Earticle

다운로드

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상
Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution

  • 간행물
    한국융합학회논문지 KCI 등재 바로가기
  • 권호(발행년)
    제8권 제5호 (2017.05) 바로가기
  • 페이지
    pp.13-17
  • 저자
    황재천
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A302230

원문정보

초록

한국어
음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률 을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼 에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상 하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼 의 인식률 향상이 있었다.
영어
Existing Speech feature extracting method in speech Signal, there are incorrect recognition rates due to incorrect speech which is not clear threshold value. In this article, the modeling method for improving speech recognition performance that combines the feature extraction for speech and silence characteristics normalized to the non-speech. The proposed method is minimized the noise affect, and speech recognition model are convergence of speech signal feature extraction to each speech frame and the silence feature normalization. Also, this method create the original speech signal with energy spectrum similar to entropy, therefore speech noise effects are to receive less of the noise. the performance values are improved in signal to noise ration by the silence feature normalization. We fixed speech and non speech classification standard value in cepstrum For th Performance analysis of the method presented in this paper is showed by comparing the results with CHMM HMM, the recognition rate was improved 2.7%p in the speech dependent and advanced 0.7%p in the speech independent.

목차

요약
 Abstract
 1. 서론
 2. 관련 연구
  2.1 음성 구간 검출
  2.2 음성 특징 추출
 3. 음성신호특징과 셉스트럽 특징 분포를 이용한 묵음특징 정규화
 4. 실험 결과
 5. 결론
 REFERENCES

저자

  • 황재천 [ Jae-Cheon Hwang | 가천대학교 컴퓨터공학과 ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국융합학회논문지 [Journal of the Korea Convergence Society]
    • 간기
      월간
    • pISSN
      2233-4890
    • 수록기간
      2010~2022
    • 십진분류
      KDC 530 DDC 620