착용형 청각기기 적용을 위한 음성 향상 신경망 연구

Oral Session Ⅱ 의료, 멀티미디어 콘텐츠

착용형 청각기기 적용을 위한 음성 향상 신경망 연구
Research on speech enhancing neural network applied to wearable hearing devices

한국어: 본 논문에서는 웨어러블 청각 기기에 적용되는 음성 향상 심층 신경망을 제안한다. 먼저 청각 기기 요구 사항에 따라 총 알고리즘 처리 지연이 8ms인 32채널 청각 필터뱅크를 구현하였다. 제안 방법의 핵심은 필터뱅크 기반이 되는 균일 다상 이산 푸리에 변환 구조에 디노이징 신경망을 구현하여 대역별 음성 향상을 이루는 것이다. 특히 각 대역의 음성 스펙트럼 위상 정보를 복원하기 위해 복소수 컨볼루션 신경망을 도입하였다. 다음으로, 청각 필터뱅크 음성 디노이징 신경망을 학습시키기 위해 각 대역의 복소수 시간 영역에서 잡음 음성신호와 깨끗한 음성신호 간의 매칭을 통한 손실 함수를 계산하였다. 제안된 청각 필터뱅크 음성 디노이징 신경망의 성능은 음성대 신호 잡음비가 -10 ~ 15dB 범위의 6가지 잡음 조건에서 객관적인 음성 인지도 및 음질 점수 측정을 통해 평가되었으며, 결과적으로, 제안 방법이 기존 방법보다 높은 인지도 와 음질 지수를 보여주었다.

자료제공 : 네이버학술정보