Semi-Supervised Learning for Audio-Visual Anomaly Recognition

Oral Session Ⅳ 인공지능 및 기계학습

간행물

한국차세대컴퓨팅학회 학술대회 바로가기
권호(발행년)

2025 한국차세대컴퓨팅학회 춘계학술대회 (2025.05) 바로가기
페이지

pp.231-232
저자

Amjid Ali, Hikmat Yar, Adnan Hussain, Altaf Hussain, Min Je Kim, Sung Wook Baik
언어

영어(ENG)
URL

https://www.earticle.net/Article/A468952

영어: Anomaly recognition in visual and audio data has gained increasing significance in computer vision, as it plays a crucial role in protecting human lives and property. In this work, we developed a semi-supervised multimodal framework for anomaly recognition that combines audio and visual data for better performance. The proposed framework employs a hybrid network consisting of a convolutional neural network, Bi-Directional Long Short-Term Memory, a multi-head attention module, and a fully connected layer for anomalous pattern recognition. We created a novel real-time visual-audio anomaly recognition dataset and evaluated our framework on it, achieving promising results.

Amjid Ali [ Digital Contents Research Institute, Sejong University ]
Hikmat Yar [ Digital Contents Research Institute, Sejong University ]
Adnan Hussain [ Digital Contents Research Institute, Sejong University ]
Altaf Hussain [ Digital Contents Research Institute, Sejong University ]
Min Je Kim [ Digital Contents Research Institute, Sejong University ]
Sung Wook Baik [ Digital Contents Research Institute, Sejong University ] Corresponding Author

자료제공 : 네이버학술정보

Earticle