Earticle

현재 위치 Home

Development of a Smartphone-Based Pronunciation Assessment and Feedback System Using Three-Dimensional Vowel Space Analysis and Lip Contour Extraction
스마트폰 기반 3차원 모음공간 분석 및 입술 윤곽 추출을 활용한 발음 평가·교정 시스템 개발

첫 페이지 보기
  • 발행기관
    중소기업융합학회 바로가기
  • 간행물
    산업과 과학 KCI 등재후보 바로가기
  • 통권
    제5권 제1호 (2026.01)바로가기
  • 페이지
    pp.72-79
  • 저자
    Hee-June Park
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A479882

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
The rapid globalization of Korean culture has precipitated a surge in Korean language learners, yet effective pronunciation training remains a significant pedagogical bottleneck. Traditional Computer-Assisted Pronunciation Training (CAPT) systems typically rely on two-dimensional acoustic analysis or automatic speech recognition confidence scores. These methods fundamentally fail to capture the temporal stability of vowel production—treating pronunciation as a static point rather than a dynamic distribution—and neglect the critical articulatory role of lip kinematics. This research presents the development of a novel smartphone-based biofeedback system that integrates 3D Vowel Space Analysis with Real-Time Lip Contour Extraction. By employing Kernel Density Estimation (KDE) on accumulated formant trajectories, the system visualizes the "density" of a learner's pronunciation in three dimensions. Simultaneously, a computer vision pipeline utilizes the MediaPipe Face Mesh to extract facial landmarks, providing immediate visual feedback on lip rounding. This multimodal approach effectively decouples acoustic errors from articulatory misconfigurations.
한국어
본 연구는 전 세계적으로 급증하는 한국어 학습 수요에 대응하여, 스마트폰만으로 정밀한 발음 교정이 가능한 시스템을 개발하는 것을 목적으로 한다. 기존의 2차원 평면 기반 음향 분석이 간과해 온 발화의 시공간적 안정성 (Stability)과 한국어 모음 변별의 핵심 기제인 입술 모양(lip rounding)을 통합적으로 분석한다. 연구 방법으로는 모바일 환경에서 선형 예측 부호화(LPC)를 통해 포먼트를 추출하고 커널 밀도 추정(KDE)을 적용하여 ‘3차원 포먼트 밀도’ 지형도 를 생성하며, 동시에 MediaPipe Face Mesh 기술로 입술의 개구도와 원순성을 정량화한다. 연구 결과, 개발된 시스템은 학습자가 생성하는 모음의 음향적 분산을 3차원 산맥 형태로 시각화하여 발음의 견고성을 인지하게 하였으며, 유사한 포먼 트 값을 가지더라도 입술 모양이 잘못된 경우를 실시간으로 탐지하여 교정 효율을 높였다. 본 연구는 ‘점’ 중심의 발음 평가를 ‘분포’ 중심으로 전환하고, 음성학과 컴퓨터 비전 기술을 융합하여 모바일 컴퓨터 기반 컴퓨터 보조 발음훈련 (computer-assisted pronunciation training; CAPT) 시스템의 새로운 표준을 제시하였다.

목차

Abstract
요약
1. 서론
1.1 연구 배경 및 필요성
2. 이론적 배경
2.1 한국어 모음 체계화 학습자 오류
2.2 3차원 모음공간과 포먼트 밀도
2.3 입술 윤곽 추출과 MediaPipe
3. 시스템 설계 및 개발
3.1 전체 시스템 구성도
3.2 3차원 모음공간 분석 알고리즘
3.3 입술 윤곽 추출
4. 구현 환경 및 결과
4.1 구현 환경
4.2 성능 최적화
5. 적용 사례 및 논의
5.1 3차원 발음 지형 기반 발음평가
5.2 안정성 점수 산출
5.3 정확성 점수 산출
5.4 종합 발음 등급 산출
5.5 실시간 교정 훈련
5.6 한계점 및 개선 방향
6. 결론
REFERENCES

키워드

3차원 모음공간 포먼트 밀도 입술윤곽추출 시각적피드백 모바일 기반 컴퓨터 보조 발음훈련 시스템 3D Vowel Space Formant Density Lip Contour Extraction Visual Biofeedback Mobile CAPT

저자

  • Hee-June Park [ 박희준 | Professor, Department of Speech and Hearing Therapy, Catholic University of Pusan ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    중소기업융합학회 [Convergence Society for SMB]
  • 설립연도
    2011
  • 분야
    공학>공학일반
  • 소개
    본 회는 정보기술을 다양한 산업 분야에 융합하는 정책 및 관련 기술들을 개발하고 보급함으로써 중소기업 발전은 물론 이를 통한 국가발전과 국제협력 증진에 기여하고자 한다.

간행물

  • 간행물명
    산업과 과학 [Advanced Industrial SCIence]
  • 간기
    격월간
  • eISSN
    2951-2476
  • 수록기간
    2022~2026
  • 등재여부
    KCI 등재후보
  • 십진분류
    KDC 004 DDC 004

이 권호 내 다른 논문 / 산업과 과학 제5권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장