In this study, we proposed a CNN-DNN based sound event detection in home IoT environments. To reduce the impact of input volume variation, we applied peak normalization, and extracted acoustic feature named Log mel filter bank. Log-mel filter bank is very popular acoustic feature based on mel filter which is powerful for speech recognition and sound event detection. Then, we used CNN-DNN model for classification. CNN outputs of sequential 32 frames were used as DNN input for considering time-series characteristic of the sound. Data were collected in real apartment environment. We used 13 sounds as target such as doorbell, babycry, vacuum, and so on. We evaluated our method using computer simulation, as a result, the accuracy of the proposed sound event detection algorithm was 90.76%.
한국어
본 연구에서는 CNN-DNN 기반의 음향인지 알고리즘을 제안하였다. 입력 볼륨에 따른 영향을 줄이기 위하여 Peak normalization을 적용하였으며, Log mel filter bank 특징벡터에 CNN을 적용하여 음향 분류에 적합한 특성을 추출하고 음향 데이터의 시계열적 특성을 고려할 수 있도록 연속되는 프레임들에서의 CNN 출력을 결합하여 DNN으로 입력하는 방법을 사용하였다. 공개 데이터가 아닌 실제 아파트 환경에서 샷 건 마이크를 이용하여 직접 수집한 데이터를 기반으로 실험을 진행하였으며, 음향의 종류는 홈 IoT(Internet of Things) 환경에서 발생할 수 있는 초인종, 음악, 도어락 등 13가지 음향을 고려하였다. 컴퓨터 시뮬레이션 평가 결과 90.76% 정확도를 얻었다.
목차
Ⅰ. 서론 Ⅱ. 딥러닝 기반의 음향인지 알고리즘 Ⅲ. 컴퓨터 시뮬레이션 결과 Ⅳ. 결론 참고문헌 국문초록 Abstract
키워드
딥러닝음향인지log mel filter bankDeep learningsound event detectionlog mel filter bank
저자
노경진 [ Noh, Kyoung-Jin | 한양대학교 전자컴퓨터통신공학과 석박사통합과정 ]
한양대학교 예술과 과학기술연구소(구 한양대학교 우리춤연구소) [Research Institute of Art and Technology]
설립연도
2005
분야
예술체육>무용
소개
2005년 3월에 발족한 '우리춤연구소'는 우리 춤의 발전을 위해 학제 간의 통합 연구뿐만 아니라, 각종 연수와 발표 활동까지 수행하는 한국 최초의 대학교 부설 우리 춤 연구기관이다.
설립 목적은 우리 춤을 체계적으로 연구하고 발전시켜 한국인의 정체성을 탐구하고, 이를 국제적 문화교류를 통해 세계만방에 널리 전파하는 것이다. 이 목적을 달성하기 위해 본 연구소에서는 학문적 연구 연구활동은 물론이고 그 연구 성과를 학교 현장에 적용하는 교육활동, 연구와 교육울 통해 알게 된 내용을 표현하거나 감상하는 공연 활동 등을 추진하고 있다. 이런한 활동은 문화산업에 다양한 소재를 제공하고, 후손에게 물려줄 무형적 가치를 창출하는 데도 기여하게 될 것이다.
간행물
간행물명
예술과 과학기술(구 우리춤과 과학기술) [Journal of Art and Technology ]