Earticle

현재 위치 Home

신호처리

음성인식 후처리에서 음소 유사율을 이용한 오류보정에 관한 연구
A Study on Error Correction Using Phoneme Similarity in Post-Processing of Speech Recognition

첫 페이지 보기
  • 발행기관
    한국ITS학회 바로가기
  • 간행물
    한국ITS학회논문지 KCI 등재후보 바로가기
  • 통권
    제6권 제3호 통권14호 (2007.12)바로가기
  • 페이지
    pp.77-86
  • 저자
    한동조, 최기호
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A65852

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Recently, systems based on speech recognition interface such as telematics terminals are being developed. However, many errors still exist in speech recognition and then studies about error correction are actively conducting. This paper proposes an error correction in post-processing of the speech recognition based on features of Korean phoneme. To support this algorithm, we used the phoneme similarity considering features of Korean phoneme. The phoneme similarity, which is utilized in this paper, rams data by mono-phoneme, and uses MFCC and LPC to extract feature in each Korean phoneme. In addition, the phoneme similarity uses a Bhattacharrya distance measure to get the similarity between one phoneme and the other. By using the phoneme similarity, the error of eo-jeol that may not be morphologically analyzed could be corrected. Also, the syllable recovery and morphological analysis are performed again. The results of the experiment show the improvement of 7.5% and 5.3% for each of MFCC and LPC.
한국어
최근 텔레매틱스 단말기 등과 같이 음성인식을 인터페이스로 하는 음성기반 검색시스템들이 많이 개발되고 있다. 그러나 음성인식에는 여전히 많은 오류가 존재하며, 이에 오류보정에 대한 여러 가지 연구가 진행되고 있다. 본 논문에서는 한국어의 음소가 갖는 특징을 기반으로 음성인식 후처리에서의 오류보정을 제안하였다. 이를 위해 한국어 음소의 특징을 고려한 음소 유사율을 사용하였다. 음소 유사율은 훈련데이터를 모노폰으로 훈련시켜 한국어 음소 각각에 대하여 MFCC와 LPC 특징추출방법을 사용하여 특징추출을 수행하고, 바타차랴 거리 측정법을 사용하여 각 음소 사이의 유사율을 구하였다. 음소 유사율과 신뢰도를 이용하여 오류보정률을 구하였으며, 이를 사용하여 음성인식 과정에서 오류로 판명된 어절에 대하여 오류보정을 수행하고, 음절 복원과 형태소 분석을 재수행하는 과정을 거쳤다. 실험 결과 MFCC와 LPC 각각 7.5%와 5.3%의 인식 향상률을 보였다.

목차

요약
 ABSTRACT
 I. 서론
 II. 음성 인식기
  1. 음절 복원
  2. 형태소 분석
 III. 음소 유사율을 이용한 오류보정
  1. 신뢰도
  2. MFCC(Mel Frequency Cepstrum Coefficient)
  3. 음소 유사율의 구성
  4. 오류보정 알고리즘
 IV. 구현 및 실험 결과 
  1. 구현
  2. 실험 결과
 V. 결론
 참고문헌

키워드

Speech recognition error correction phoneme similarity MFCC LPC Bhattacharrya distance

저자

  • 한동조 [ Dong-Jo Han | 광운대학교 컴퓨터공학과 박사과정 ]
  • 최기호 [ Ki-Ho Choi | 광운대학교 컴퓨터공학과 교수 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국ITS학회 [The Korean Society of Intelligent Transport Systems]
  • 설립연도
    2002
  • 분야
    공학>교통공학
  • 소개
    ◈ 전문분야간 공동협의, 공동연구를 통한 ITS의 학술적 발전 ◈ 산·학·연 협동체계 구축으로 기술개발 지원 ◈ 정부정책 및 제도 방향에 대한 기술적 자문 ◈ 외국 ITS 관련 학술단체와 기술교류 ◈ 관련전문가 및 기술자의 교육 및 양성

간행물

  • 간행물명
    한국ITS학회논문지 [The Journal of The Korean Society of Intelligent Transport Systems]
  • 간기
    격월간
  • pISSN
    1738-0774
  • eISSN
    2384-1729
  • 수록기간
    2003~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 326 DDC 338

이 권호 내 다른 논문 / 한국ITS학회논문지 제6권 제3호 통권14호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장