최근에 심층신경망(DNN)에 기초한 모형화방법이 급속히 발전하여 음성 인식성능이 크게 개선되고있다. 론문에서는 DNN 음향모형을 리용하여 조선어 열린어휘음성인식의 성능을 개선하는 방법을 서술하였다. 발성자독립 및 적응된 DNN 모형들을 훈련하는 방법을 주었으며 DNN 모형이 GMM 모형에 비하여 음소오유률(PER)을 30%정도 줄인다 는것을 보여주었다. 또한 음성인 식기《룡남산》에서 OOV 률이 다른 2 가지 시험자료에 대하여 DNN 모형의 성능 을 평가하였다. OOV 률이 낮은 자료에 대하여 글자오유률(CER)이 상대적 으로 74.4%정도, OOV 률이 높은 자료 에 대하여 39.4% 줄어들었다. 일부 응용들에서 숨은 층개수가 작은 모형들을 리용하는것이 리득일수 있으며 숨은 층개수가 많은 모형이 여러가지 변동에 더 로바스트적이라는것을 보여주었다. 저위수근사화와 공학적최량화에 의하여 모형크기와 사후확률평가시간이 15 배정도 단축되였다.
목차
초록 1. 서론 2. <룡남산> 기준음성인식체계 2.1 인식단위와 어휘사전 2.2 음향모형 2.3 언어모형 2.4 복호화 3. DNN에 기초한 모형화 3.1 훈련 및 시험을 위한 음성자료 3.2 DNN-HMM 모형훈련 3.3 모형크기축소와 복호화속도개선 4. 실험결과 4.1 GMM 과 DNN 모형의 성능비교 4.2 저위수근사화와 공학적최량화에 대한 평가 5. 결론 6. 앞으로의 연구방향 참고문헌
한국어정보학회 [Korean Language Information Science Society]
설립연도
1990
분야
인문학>언어학
소개
학술적인 연구를 통하여 국어정보처리에 관련된 이론 체계를 정립하고, 산업계와의 긴밀한 협동을 통하여 정보처리 기술을 향상 시키면서 정보산업의 성장을 돕고, 대중적인 교육과 홍보를 통하여 발전된 정보 처리의 기술을 보급하므로써 국어의 문화적 가치를 높히고 국어정보 처리 기술의 국제적 지위향상과 표준화에 기여하고자 합니다.