Earticle

다운로드

전화망 음성 데이터를 이용한 향상된 음성 특징 추출 방법
Improvement Speech Feature Extraction Method Using Telephone Speech Data

  • 간행물
    차세대융합기술학회논문지 바로가기
  • 권호(발행년)
    제1권 4호 (2017.12) 바로가기
  • 페이지
    pp.181-185
  • 저자
    이철희
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A341417

원문정보

초록

한국어
본 논문은 음성 인식률 향상을 위한 여러 가지 방법들 중에서 음성특징 파라미터 추출 방법에 관한 한 가지 방법을 제시하였다. 본 논문에서는 청각 특성을 기반으로 한 MFCC(mel frequency cepstrum coefficients)와 성능 향상 을 위한 방법으로 GFCC (gammatone filter frequency cepstrum coefficients)를 제시하고 음성 인식을 수행하여 성능을 비교하였다. MFCC에서 일반적으로 사용하는 임계 대역 필터로 삼각 필터(triangular filter) 대신 청각 구조의 기저막 (basilar membrane)특성을 묘사한 gammatone 대역 통과 필터를 이용하여 특징 파라미터를 추출하였다. 인식 알고리즘 으로 사용하여 LPCC(linear prediction cepstrum coefficient), MFCC와 GFCC의 각 인식 성능을 비교하였다.
영어
In this paper, we study a method extracting the speech feature parameter in many methods for improving the speech recognition rate. MFCC(Mel Frequency Cepstral Coefficient) based on the auditory characteristic and GFCC(Gammatone filter Frequency Cepstrum Coefficient) for improving performance of MFCC are suggested and telephone speech recognition also. Feature parameter is extracted with gammatone bandpass filter depicted basilar membrane characteristic of auditory structure instead of triangular filter generally used for critical bandwidth filter in MFCC. In experiments, we compared LPCC and MFCC. CMS(Cepstral Mean Subtraction) is used for compensating channel distortion in telephone and shows improvement in recognition.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 본론
2.1 전화망 채널 보상 방법
2.2 CMS(Cepstral Mean Subtraction)
2.3 기저막 특성의 대역 통과 필터
2.4 기저막 특성을 이용한 파라미터 추출
Ⅲ. 실험 및 결과
Ⅳ. 결론
REFERENCES

저자

  • 이철희 [ Chul-Hee Lee | ILS Co., Ltd. 연구소장 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      차세대융합기술학회논문지 [The Journal of Next-generation Convergence Technology Association]
    • 간기
      월간
    • pISSN
      2508-8270
    • 수록기간
      2017~2026
    • 등재여부
      KCI 등재
    • 십진분류
      KDC 506 DDC 606