Earticle

현재 위치 Home

데이터 없는 비전 트랜스포머 경량화에서 희소 모델 인버전의 효과적인 강건성 향상 방법론
Effective Robustness Enhancement Methodology of Sparse Model Inversion in Data-Free Vision Transformer Compression

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
  • 통권
    Vol.21 No.5 (2025.10)바로가기
  • 페이지
    pp.101-110
  • 저자
    허성수, 최동완
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A475399

원문정보

초록

영어
Model inversion is a widely used technique in data-free learning, where synthetic inputs are reconstructed from a pretrained model through iterative optimization without access to the original training data. However, when applied to modern Vision Transformers, the high computational cost of the self-attention mechanism poses a significant challenge. Sparse Model Inversion (SMI) has been proposed to improve efficiency by removing non-essential patches. Nevertheless, in the absence of real validation data, the instability of training remains an unresolved issue, as model accuracy becomes uncertain and exhibits high variance. To address this, we propose a method that consistently preserves the quality and diversity of generated images in data-free environments, thereby reducing the standard deviation of accuracy and enhancing model robustness. The proposed Adaptive AEM readjusts the importance after patch removal to promote entropy minimization. Experimental results demonstrate that using images generated by our method reduces the standard deviation of accuracy by up to 72% in data-free quantization and up to 49% in data-free knowledge distillation, compared to previous approaches, leading to significantly more robust models.
한국어
모델 인버전은 원본 학습 데이터 없이, 사전 학습된 모델로부터 반복적인 최적화를 통해 합성 입력을 복원하는 데이 터 없는 학습에서 널리 사용되는 기법이다. 그러나 최신 비전 트랜스포머에 이를 적용할 경우, 고비용의 셀프 어텐 션 메커니즘으로 인해 큰 계산적 부담이 발생하게 된다. 이를 중요하지 않은 패치들을 모두 제거함으로써 효율성을 향상시키는 희소 모델 인버전이 제안되었다. 하지만 데이터가 없는 상황에서 검증 데이터의 부재로 인한 학습 불안 정성의 증폭은 여전히 해결해야 할 문제로 남아 있다. 검증 데이터가 없는 환경에서는 모델의 정확도가 불확실해지 고, 변동성이 커지므로, 모델의 강건성 향상이 필수적이다. 본 논문에서는 데이터 없는 환경에서 생성되는 이미지의 품질과 다양성을 일관되게 유지하여, 정확도에 대한 표준편차를 낮추고 강건성을 향상시키는 방법을 제안한다. 제안 한 Adaptive AEM은 패치 제거 이후의 중요도를 재조정해 엔트로피 최소화를 촉진시킨다. 실험 결과, 제안한 방법 으로 생성된 이미지를 사용하면 이전 방법론에 비해 데이터 없는 양자화에서는 최대 72%, 데이터 없는 지식 증류 에서는 최대 49%까지 정확도의 표준편차를 줄여 모델을 강건하게 만들 수 있음을 입증한다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 데이터 없는 적용(Data-free Applications)
2.2 모델 인버전(Model Inversion)
2.3 토큰 희소화(Token Sparsification)
2.4 희소 모델 인버전(Sparse Model Inversion)
3. 방법
3.1 문제 정의(Problem Definition)
3.2 Average Attention Matrix(AAM)
3.3 Attention Entropy Minimization(AEM)
3.4 적응형 어텐션 엔트로피 최소화(Adaptive AEM)
4. 실험
4.1 실험 환경(Experimental Setup)
4.2 실험 결과(Experimental Result)
4.3 하이퍼파라미터 최적화
5. 결론
참고문헌

키워드

데이터 없는 적용 모델 압축 비전 트랜스포머 강건성 향상 학습 불안정성 data-free application model compression vision transformer robustness enhancement training instability

저자

  • 허성수 [ Seongsoo Heo | 인하대학교 전기컴퓨터공학과 ]
  • 최동완 [ Dong-Wan Choi | 인하대학교 전기컴퓨터공학과 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.21 No.5

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장