Earticle

다운로드

학습 데이터가 없는 모델 탈취 방법에 대한 분석
Analysis of methods for the model extraction without training data

  • 간행물
    융합보안논문지 KCI 등재 바로가기
  • 권호(발행년)
    제23권 제5호 (2023.12) 바로가기
  • 페이지
    pp.57-64
  • 저자
    권현, 김용기, 이준
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A440971

원문정보

초록

한국어
딥뉴럴네트워크 모델의 취약점으로 모델 탈취 방법이 있다. 이 방법은 대상 모델에 대하여 여러번의 반복된 쿼 리를 통해서 유사 모델을 생성하여 대상 모델의 예측값과 동일하게 내는 유사 모델을 생성하는 것이다. 본 연구에 서, 학습 데이터가 없이 대상 모델을 탈취하는 방법에 대해서 분석을 하였다. 생성 모델을 이용하여 입력 데이터 를 생성하고 대상 모델과 유사 모델의 예측값이 서로 가까워지도록 손실함수를 정의하여 유사 모델을 생성한다. 이 방법에서 대상 모델의 입력 데이터에 대한 각 클래스의 logit(로직) 값을 이용하여 경사하강법으로 유사 모델 이 그것과 유사하도록 학습하는 과정을 갖는다. 실험 환경으로 pytorch 머신러닝 라이브러리를 이용하였으며, 데 이터셋으로 CIFAR10과 SVHN을 사용하였다. 대상 모델로 ResNet 모델을 이용하였다. 실험 결과로써, 모델 탈취 방법은 CIFAR10에 대해서 86.18%이고 SVHN에 대해서 96.02% 정확도로 대상 모델과 유사한 예측값을 내는 유 사 모델을 생성하는 것을 볼 수가 있었다. 추가적으로 모델 탈취 방법에 대한 고려사항와 한계점에 대한 고찰도 분석하였다.
영어
In this study, we analyzed how to steal the target model without training data. Input data is generated using the generative model, and a similar model is created by defining a loss function so that the predicted values of the target model and the similar model are close to each other. At this time, the target model has a process of learning so that the similar model is similar to it by gradient descent using the logit (logic) value of each class for the input data. The tensorflow machine learning library was used as an experimental environment, and CIFAR10 and SVHN were used as datasets. A similar model was created using the ResNet model as a target model. As a result of the experiment, it was found that the model stealing method generated a similar model with an accuracy of 86.18% for CIFAR10 and 96.02% for SVHN, producing similar predicted values to the target model. In addition, considerations on the model stealing method, military use, and limitations were also analyzed.

목차

요약
ABSTRACT
1. 서론
2. 관련연구
3. 모델 탈취 방법
4. 실험 및 평가
4.1 데이터셋
4.2 대상 모델과 유사 모델
4.3 실험결과
4.4 분석 및 논의
5. 결론
참고문헌

저자

  • 권현 [ Hyun Kwon | 육군사관학교 AI·데이터과학과 부교수 ] 주저자
  • 김용기 [ Yonggi Kim | 과학기술정책연구원 과학기술외교안보연구단 부연구위원 ]
  • 이준 [ Jun Lee | 호서대학교 게임소프트웨어학과 교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      융합보안논문지 [Jouranl of Information and Security]
    • 간기
      연5회
    • pISSN
      1598-7329
    • 수록기간
      2001~2026
    • 등재여부
      KCI 등재
    • 십진분류
      KDC 005 DDC 005