Earticle

현재 위치 Home

군사적 환경에서 음성인식 모델의 취약성에 관한 연구
Study on the Vulnerabilities of Automatic Speech Recognition Models in Military Environments

첫 페이지 보기
  • 발행기관
    한국융합보안학회 바로가기
  • 간행물
    융합보안논문지 KCI 등재 바로가기
  • 통권
    제24권 제2호 (2024.06)바로가기
  • 페이지
    pp.201-207
  • 저자
    원엘림, 나성중, 고영진
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A452775

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Voice is a critical element of human communication, and the development of speech recognition models is one of the si gnificant achievements in artificial intelligence, which has recently been applied in various aspects of human life. The appli cation of speech recognition models in the military field is also inevitable. However, before artificial intelligence models ca n be applied in the military, it is necessary to research their vulnerabilities. In this study, we evaluates the military applica bility of the multilingual speech recognition model "Whisper" by examining its vulnerabilities to battlefield noise, white noi se, and adversarial attacks. In experiments involving battlefield noise, Whisper showed significant performance degradation with an average Character Error Rate (CER) of 72.4%, indicating difficulties in military applications. In experiments with white noise, Whisper was robust to low-intensity noise but showed performance degradation under high-intensity noise. A dversarial attack experiments revealed vulnerabilities at specific epsilon values. Therefore, the Whisper model requires impr ovements through fine-tuning, adversarial training, and other methods.
한국어
목소리는 인간의 의사소통에서 중요한 요소로, 음성인식 모델의 발전은 인공지능의 중요한 성과 중 하나이며 최근 인간의 생활에 다방면으로 사용되고 있다. 음성인식 모델의 활용은 군사분야에서도 피해갈 수 없는 과제이다. 하지만 인공지능 모델 의 군사적 활용 이전에 모델의 취약성에 대한 연구가 필요하다. 본 연구에서는 다국적 음성인식 모델인 Whisper의 군사적 활 용 가능성을 알아보기 위해, 전장소음, 잡음, 적대적 공격에 대한 취약성을 평가하였다. 전장소음을 포함하는 실험에서는 Whisper의 성능 저하가 크게 나타났으며, 평균 72.4%의 문자 오류율(CER)을 기록하여 군사적 활용에 어려움이 있는 것으로 나타났다. 또한, 잡음을 포함하는 실험에서는 낮은 강도의 잡음에 대해 Whisper가 강건하였으나, 높은 강도의 잡음에서는 성 능이 저하되었고, 적대적 공격 실험에서는 특정 입실론 값에서 취약성이 드러났다. 따라서 Whisper 모델을 군사적 환경에서 사용하기 위해서는 파인튜닝, 적대적 훈련 등을 통해 개선이 필요하다는 것을 시사한다.

목차

요약
ABSTRACT
1. 서론
2. 관련연구
2.1 음성인식모델
2.2 음성인식모델의 강건성
2.3 음성인식모델에 대한 적대적 공격
3. 실험환경 및 데이터
3.1 음성데이터
3.2 음성인식모델
3.3 평가지표
4. 실험결과
4.1 전장소음에 대한 취약성
4.2 잡음에 대한 취약성
4.3 적대적 공격에 대한 취약성
5. 결론
6. 향후 연구
참고문헌

키워드

Automatic Speech Recognition Battlefield noise Adversarial attack Vulnerability

저자

  • 원엘림 [ Elim Won | 육군 지능정보기술단 체계관리SW분석장교 ] 주저자
  • 나성중 [ Seongjung Na | 국방대학교 군사운영분석 박사과정 ] 공동저자
  • 고영진 [ Youngjin Ko | 육군사관학교 컴퓨터과학과 강사 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국융합보안학회 [Korea Information Assurance Society]
  • 설립연도
    2001
  • 분야
    공학>전자/정보통신공학
  • 소개
    본 학회는 사이버테러 및 정보전에 관한 학문연구ㆍ기술 개발ㆍ기반 구축을 도모하고 국내ㆍ외 관계기관과 학술교류와 정보교환을 통하여 회원 상호간의 전문지식을 배양하고, 궁극적으로는 국가 중요 정보기반구조를 보호함을 그 목적으로 한다.

간행물

  • 간행물명
    융합보안논문지 [Jouranl of Information and Security]
  • 간기
    연5회
  • pISSN
    1598-7329
  • 수록기간
    2001~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 005 DDC 005

이 권호 내 다른 논문 / 융합보안논문지 제24권 제2호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장