STT·LLM 자동화 공격 대응을 위한 외국어 합성 음성 CAPTCHA 설계

박은서; 김희연; 박태정

216.73.216.25

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

STT·LLM 자동화 공격 대응을 위한 외국어 합성 음성 CAPTCHA 설계
Design of a Foreign-Language Mixed Audio CAPTCHA Against STT and LLM-based Attacks

발행기관

한국융합보안학회 바로가기
간행물

융합보안논문지 KCI 등재 바로가기
통권

제26권 제2호 (2026.03)바로가기
페이지

pp.39-45
저자

박은서, 김희연, 박태정
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A482846

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어: Recent studies report growing cases where audio CAPTCHAs are defeated using purely software-based approaches that combine speech-to-text (STT) systems with large language models (LLMs), raising concerns about their reliability for human authentication. As AI-based speech recognition and speaker separation advance, traditional defenses such as noise injection and time-warping are increasingly vulnerable. To address this, we propose a Foreign-Language Mixed Audio CAPTCHA based on psychoacoustic principles. The method overlays foreign-language synthetic speech onto Korean questions, inducing cross-linguistic acoustic interference that remains understandable to humans but difficult for STT systems to recognize. Experiments show that STT accuracy drops as foreign-language intensity increases, reaching about 6% at a 1.1× scale, while human accuracy averages 50.3%, roughly eight times higher. Pitch shifting also provides partial defense against speaker separation attacks. These results indicate that combining language mixing with acoustic modulation offers a promising direction for resisting automated audio attacks.

한국어: 최근 STT(Speech-To-Text)와 대규모 언어모델(LLM)의 결합으로 소프트웨어적인 수단만으로 오디오 CAPTCHA를 무력 화하는 사례가 증가하고 있다는 연구 결과가 보고되면서, 인간 인증 수단으로서의 신뢰성 저하 우려가 제기되고 있다. 따라서 인공지능에 기초한 최신 음성 인식 및 화자 분리 기술의 발전으로 기존의 잡음 주입이나 시간 왜곡 기반 방어 기술 역시 무력 화될 가능성이 높다. 본 연구는 이러한 기술적 환경 속에서 심리음향학적 원리를 적용한 외국어 합성 음성 CAPTCHA (Foreign-Language Mixed Audio CAPTCHA)를 제안한다. 제안 기법은 한국어 질문 위에 외국어 음성을 중첩하여 언어 간 음향 간섭을 유도함으로써, 인간은 문맥을 이해할 수 있으나 STT는 인식하기 어려운 음성 정보를 생성한다. 실험 결과, STT 정답률은 외국어 음성 스케일이 커질수록 감소해 1.1배 구간에서 약 6%로 하락했으며, 인간 인식률은 평균 50.3%로 STT 대 비 약 8배 높았다. 또한 Pitch Shifting 적용 시 화자분리 공격에 대한 방어 효과가 일부 확인되었다. 이러한 결과는 언어 혼합 과 음향 변조를 결합한 심리음향학적 접근이 자동화 음성 공격에 대응할 수 있는 새로운 CAPTCHA 설계 방향의 가능성을 시사한다.

요약
ABSTRACT
1. 서론
2. 관련 연구
3. 실험 방법
3.1 실험 개요
3.2 실험 환경
3.3 실험 1 단계: 인간 사용자 청취 인식 실험
3.4 실험 2 단계: STT 인식률 분석
3.5 실험 3 단계: 인간 인식률 검증
4. 실험 결과 및 분석
4.1 Pitch Shifting On/Off별 정답률 비교
4.2 언어별 Pitch Shifting 결과
4.3 STT–인간 인식률 비교
5. 결론
참고문헌

키워드

Audio CAPTCHA STT Attack LLM-based Automation Psychoacoustic Defense Speaker Separation

저자

박은서 [ Eunseo Park | 덕성여자대학교 사이버보안전공 학부생 ] 주저자
김희연 [ Heeyeon Kim | 덕성여자대학교 사이버보안전공 학부생 ] 공동저자
박태정 [ Taejung Park | 덕성여자대학교 사이버보안전공 교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국융합보안학회 [Korea Information Assurance Society]
설립연도
2001
분야
공학>전자/정보통신공학
소개
본 학회는 사이버테러 및 정보전에 관한 학문연구ㆍ기술 개발ㆍ기반 구축을 도모하고 국내ㆍ외 관계기관과 학술교류와 정보교환을 통하여 회원 상호간의 전문지식을 배양하고, 궁극적으로는 국가 중요 정보기반구조를 보호함을 그 목적으로 한다.

간행물

간행물명

융합보안논문지 [Jouranl of Information and Security]
간기
연5회
pISSN
1598-7329
수록기간
2001~2026
등재여부
KCI 등재
십진분류
KDC 005 DDC 005

이 권호 내 다른 논문 / 융합보안논문지 제26권 제2호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

STT·LLM 자동화 공격 대응을 위한 외국어 합성 음성 CAPTCHA 설계
Design of a Foreign-Language Mixed Audio CAPTCHA Against STT and LLM-based Attacks

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 융합보안논문지 제26권 제2호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

STT·LLM 자동화 공격 대응을 위한 외국어 합성 음성 CAPTCHA 설계 Design of a Foreign-Language Mixed Audio CAPTCHA Against STT and LLM-based Attacks

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 융합보안논문지 제26권 제2호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

STT·LLM 자동화 공격 대응을 위한 외국어 합성 음성 CAPTCHA 설계
Design of a Foreign-Language Mixed Audio CAPTCHA Against STT and LLM-based Attacks