오토인코더 전처리를 적용한 CNN 기반 평발 진단 모델 및 XAI를 이용한 유효성 검증
CNN-Based Flatfoot Diagnosis Model with Autoencoder Preprocessing and Effectiveness Verification Using XAI
Despite the high classification performance of CNN-based medical image diagnosis models, they often lack explainability and are prone to shortcut learning caused by data bias or noise. These limitations hinder the reliability and clinical applicability of medical AI systems. In this paper, we propose an autoencoder (AE)-based preprocessing method to improve both explainability (XAI) and classification performance for flatfoot diagnosis. A Variational Autoencoder (VAE) is used to reconstruct input images, and multiple error maps are generated from reconstruction discrepancies. These maps are combined into multi-channel inputs and fed into a CNN for classification. In addition, Grad-CAM is applied to visualize decision regions, and the impact of VAE preprocessing on both performance and XAI clarity is analyzed. Experimental results show that the proposed method improves both XAI clarity and classification performance, achieving an accuracy of 0.9915 and a Macro F1-Score of 0.9856. This corresponds to improvements of approximately 18 percentage points in accuracy and over 0.53 in F1-Score compared to the baseline model. This study contributes to enhancing both the reliability and explainability of AI systems for flatfoot diagnosis.
한국어
기존 CNN 기반 의료 영상 진단 모델은 높은 분류 성능에도 불구하고, 판단 근거에 대한 설명 가능성이 부족하며 데이터 편향이나 노이즈에 의존하는 숏컷 학습(shortcut learning) 문제가 존재한다. 이러한 한계는 의료 AI의 신뢰성과 임상적 활용 가능성을 저해하는 주요 요인이다. 본 논문에서는 평발 진단을 위한 CNN 기반 모델의 설명 가능성(XAI)과 분류 성능을 동시에 향상시키기 위해 오토인코더(Autoencoder, AE) 기반 전처리 기법을 제안한다. 먼저, 변분 오토인코더(Variational Autoencoder, VAE)를 이용해 입력 영상을 복원하고, 원본과의 차이로부터 다양한 오류 맵을 생성한다. 이후 이를 다중 채널로 구성하여 CNN에 입력함으로써 평발 여부를 분류한다. 또한 Grad-CAM을 활용하여 모델의 판단 근거를 시각화하고, VAE 전처리 적용 여부에 따른 성능과 XAI 시각화의 변화를 분석한다. 실험 결과, 제안 방법은 XAI 시각화의 명확도를 향상시켰을 뿐만 아니라, 정확도 0.9915와 Macro F1-Score 0.9856을 달성하여 baseline 대비 각각 약 18%p와 0.537 이상 향상됨을 확인하였다. 본 연구는 평발 진단 AI의 신뢰성과 설명 가능성을 동시에 향상시키는 데 기여할 수 있다.
목차
요약 Abstract 1. 서론 2. 관련 연구 3. AE 기반 평발 진단용 CNN 모델 설계 3.1 VAE 기반 오류 맵 생성 3.2 CNN 기반 평발(Flatfoot) 진단 및 성능 평가 3.3 Grad-CAM 기반 XAI 분석 4. 실험 결과 4.1 데이터셋 및 전처리 4.2 정량적 평가 4.3 정성적 평가 4.4 Ablation Study 5. 고찰 (Discussion) 5.1 SOTA 모델에서의 일반화 및 강건성 검증 5.2 정량적 분석 6. 결론 Acknowledgement 참고문헌
키워드
평발오토인코더설명가능 인공지능(XAI)오류 맵FlatfootAutoencoderExplainable AI (XAI)Error Map