Earticle

다운로드

착용형 청각기기 적용을 위한 음성 향상 신경망 연구
Research on speech enhancing neural network applied to wearable hearing devices

  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 권호(발행년)
    2024 한국차세대컴퓨팅학회 춘계학술대회 (2024.04) 바로가기
  • 페이지
    pp.90-91
  • 저자
    김선만, 박주영
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A468732

원문정보

초록

한국어
본 논문에서는 웨어러블 청각 기기에 적용되는 음성 향상 심층 신경망을 제안한다. 먼저 청각 기기 요구 사항에 따라 총 알고리즘 처리 지연이 8ms인 32채널 청각 필터뱅크를 구현하였다. 제안 방법의 핵심은 필터뱅크 기반이 되는 균일 다상 이산 푸리에 변환 구조에 디노이징 신경망을 구현하여 대역별 음성 향상을 이루는 것이다. 특히 각 대역의 음성 스펙트럼 위상 정보를 복원하기 위해 복소수 컨볼루션 신경망을 도입하였다. 다음으로, 청각 필터뱅크 음성 디노이징 신경망을 학습시키기 위해 각 대역의 복소수 시간 영역에서 잡음 음성신호와 깨끗한 음성신호 간의 매칭을 통한 손실 함수를 계산하였다. 제안된 청각 필터뱅크 음성 디노이징 신경망의 성능은 음성대 신호 잡음비가 -10 ~ 15dB 범위의 6가지 잡음 조건에서 객관적인 음성 인지도 및 음질 점수 측정을 통해 평가되었으며, 결과적으로, 제안 방법이 기존 방법보다 높은 인지도 와 음질 지수를 보여주었다.

목차

요약
1. 서론
2. 제안 청각기기 음성 디노이징 모델
3. 실험 결과 및 고찰
4. 결론
Acknowledgement
참고문헌

저자

  • 김선만 [ 공간광정보연구센터 한국광기술원 ]
  • 박주영 [ 공간광정보연구센터 한국광기술원 ]

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국차세대컴퓨팅학회 학술대회
    • 간기
      반년간
    • 수록기간
      2021~2025
    • 십진분류
      KDC 566 DDC 004