CAPTCHA(Completely Automated Public Turing Test to tell Computers and Humans Apart)는 자동화된 봇 공격을 방지 하는 핵심 수단이다. 그러나 STT(Speech-to-Text) 기술 및 전반적인 LLM 기술의 고도화로 기존의 음성 CAPTCHA는 기계 에 의해 쉽게 해독되어 보안성이 심각하게 저하되고 있다. 본 연구는 이러한 문제를 해결하기 위해 한국어의 음운론적 특성을 활용한 ‘한국어 난독화 음성 CAPTCHA’ 시스템을 설계하고 구현하였다. 제안된 시스템은 한국어의 겹받침 및 연음 규칙을 의 도적으로 적용하여, 사람은 문맥과 청각적 단서를 이용해 의미를 파악할 수 있으나 STT는 음소, 문자 대응 과정에서 오류를 일으키도록 설계되었다. STT를 대상으로 한 실험 결과, 기존 CPATCHA 대비 STT의 인식률이 약 10% 이하로 감소하였으 나, 인간 청취자의 평균 정답률은 50% 이상으로 유지되었다. 이는 제안된 한국어 난독화 음성 CAPTCHA가 언어적 변형만으 로도 실질적인 보안성 확보가 가능함을 보여준다. 따라서 본 연구는 기게 학습 기반 공격이 급증하는 환경에서 한국어 고유의 음운 특성을 활용한 언어 기반 CAPTCHA 방어 전략의 가능성을 제시한다.
영어
CAPTCHA (Completely Automated Public Turing Test to tell Computers and Humans Apart) is a key mechanism for preventing automated bot attacks. However, advances in speech-to-text (STT) and large language model (LLM) technologies have made conventional audio CAPTCHAs easily solvable by machines, significantly degrading their security. To address this issue, this study proposes a “Korean Obfuscated Audio CAPTCHA” that exploits Korean phonological features. By intentionally applying consonant cluster and liaison rules, the system allows humans to infer meaning from context and auditory cues while inducing phoneme-to-character errors in STT systems. Experiments show that STT accuracy drops to below 10% compared to conventional CAPTCHAs, while human accuracy remains above 50%. These results demonstrate that linguistic obfuscation alone can provide effective security, highlighting the potential of Korean-specific, language-based CAPTCHA defenses against machine learning–based attacks.
목차
요약 ABSTRACT 1. 서론 2. 관련 연구 2.1 오디오 CAPTCHA 우회 기술 2.2 신호 기반 접근 연구와 한계 3. 한국어 난독화 기반 음성 CAPTCHA 설계 3.1 설계 개요 3.2 한국어 난독화 규칙 설계 3.3 겯받침과 연음 규칙을 활용한 한국어 난독화음성 CAPTCHA 설계 3.4 한국어 난독화 구현 및 예시 4. 실험 및 결과 4.1 실험 설계 4.2 실험 결과 5. 결론 참고문헌