청력 증강 신경망 모델의 실시간 구현을 위한 안드로이드 저지연 오디오 플랫폼 탐색 연구
Exploratory study on Android low-latency audio platform for real-time implementation of hearing augmentation neural network model
본 연구는 기존에 제안된 청력 보조용 음성 향상 신경망 모델을 안드로이드 환경에서 실시간으로 구현하기 위한 초기 탐색을 목적으로 한다. 기존 알고리즘은 8ms 이내의 지연시간을 목표로 설계되었 으며, 실제 청력 보조기기에 적용되기 위해서는 전체 시스템 지연시간이 10ms 이내로 제한되어야 한 다. 이를 위해 안드로이드 개발 환경에서의 시간 지연 특성을 분석하고, NDK 기반 바이패스 구조를 이용하여 마이크 입력에서 스피커 출력까지의 스트림을 구현하였다. 실험 장치는 Galaxy S24 Ultra이 며, SDK 기반 구현에서는 청감상 에코가 발생하였으나 NDK 기반에서는 명확한 개선이 확인되었다. 현재는 정확한 시간 지연 측정을 위한 실험 환경을 구축 중이며, 향후 ONNX 변환된 딥러닝 모델을 NPU 상에서 구동하는 것을 목표로 한다. 본 연구는 안드로이드 기반 플랫폼이 청각 증강 알고리즘 적용에 적합한지를 탐색하고자 하는 진행 중 연구로서 그 가능성을 보고한다.
목차
요약 1. 서론 2. 관련 청력 증강 심층 신경망 연구 3. 안드로이드 기반 저 지연 오디오 구현 검토 4. 결론 Acknowledgement 참고문헌