신용대출 사기는 금융회사의 부실화를 야기시키는 중요한 위험 요소이다. 따라서, 신용대출 사기예측은 금융회사의 입장에서 볼 때, 손실을 줄일 수 있는 매우 중요한 일이다. 이러한, 신용대출 사기예측 모형을 구축할 때 고려해야 점은 크게 두 가지가 이다. 첫째, 사기 고객과 정상 고객의 데이터 분포가 한쪽으로 심하게 치우쳐 있다는 점과 둘째, 구축한 모형을 통해 고객을 분류할 때 분류결과에 따라 발생하는 비용이 일반적으로 서로 다르다는 점이다. 본 논문에서는 한국의 한 금융회사의 신용대출 데이터를 이용하여 사기 고객과 정상 고객의 데이터 분포를 변경하면서, 비용을 고려하지 않고 단순히 예측 정확도가 높은 모형을 추구하는 전통적인 분류모형과 비용을 고려하되 최소비용을 발생 시키는 모형을 추구하는 MetaCost와 CSC (약자)를 비교하였다. 실험결과, 전통적인 분류모형과 MetaCost 사이에서는 발생 비용이 유의한 차이를 보인 반면, 전통적인 분류모형과 CSC 사이에서 그리고 MetaCost와 CSC 사이에서는 발생 비용이 유의한 차이를 보이지 않았다.
목차
Abstract 1. 서론 2. 문헌연구 2.1 사기 예측을 위한 데이터 마이닝 적용 2.2 Cost-Sensitive Learning 3. 데이터 및 실험 모형 3.1 실험데이터 및 실험 절차 3.2 입력데이터의 전처리 3.3 모형 구축 4. 실험 결과 및 해석 5. 결론 참고문헌