Earticle

현재 위치 Home

금융 이상 거래 탐지에서의 Semi-Hard Example Mining 기반 불균형 데이터 증강 기법
Imbalanced Data Augmentation Based on Semi-Hard Example Mining for Financial Fraud Detection Systems

첫 페이지 보기
  • 발행기관
    한국경영정보학회 바로가기
  • 간행물
    경영정보학연구 KCI 등재 바로가기
  • 통권
    제27권 제3호 (2025.08)바로가기
  • 페이지
    pp.375-397
  • 저자
    강경태, 김성재, 조용복
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A471859

※ 기관로그인 시 무료 이용이 가능합니다.

6,000원

원문정보

초록

영어
The rapid rise in fraudulent financial transactions is inflicting substantial economic losses, yet effective detection remains difficult because genuine fraud represents only a tiny fraction of overall activity. To overcome this extreme class-imbalance problem, we propose a model that integrates a Variational Autoencoder Generative Adversarial Network (VAE-GAN) with Semi-Hard Example Mining (SHEM). The VAE-GAN synthesizes high-fidelity minority-class samples that closely mimic real transactions, while SHEM repeatedly targets borderline cases that the classifier is prone to misjudge, thereby reducing false negatives (fraudulent transactions incorrectly labeled as legitimate). Experiments on a benchmark credit- card-fraud dataset show that our method consistently outperforms interpolation-based oversampling techniques (SMOTE, Borderline-SMOTE, ADASYN) and a vanilla VAE-GAN baseline, achieving higher Precision, Recall, F1, and F2 scores. These results demonstrate the model’s potential to alleviate class imbalance and maximize detection performance in financial-sector fraud-detection systems(FDS).
한국어
최근 급격히 증가하고 있는 금융 이상 거래는 막대한 경제적 손실을 일으키고 있다. 하지만 금융 이상 거래 탐지에 이용되는 데이터에서 이상 거래는 정상 거래에 비해 극히 적어 효과적인 탐지를 어렵게 하는 불균형 데이터 문제가 제기되어왔다. 본 연구는 이러한 불균형한 데이터 특성의 한계를 극복하기 위해 VAE-GAN(Variational Autoencoder-Generative Adversarial Network) 과 Semi-Hard Example Mining 기법을 결합하여, 이상 거래 데이터의 품질을 유지하면서 실제로 이상 거래이지만 정상 거래로 판단하는 거짓 음성(False Negative)을 줄이는 모델을 제안한다. 먼저, VAE-GAN을 통해 실제 거래와 유사한 소수 클래스 합성 데이터를 생성하고, Semi-Hard Example Mining으로 분류기가 헷갈리기 쉬운 사례를 집중적으로 재생성한다. 이를 신용카드 이상 거래 데이터셋에 적용한 결과, 기존 보간 기반 오버샘플링 기법(SMOTE, Borderline-SMOTE, ADASYN)과 기존 VAE-GAN 증강 대비 재현율(Recall), F2 스코어(F2 Score)가 향상됨을 확인하였다. 본 연구는 금융권 FDS(Fraud Detection System)에서 불균형 데이터 문제를 완화하고 탐지 성능을 극대화하는 데 기여할 것으로 기대한다.

목차

요약
Ⅰ. 서론
Ⅱ. 이론적 배경
2.1 FDS의 개념 및 동향
2.2 불균형 데이터(Imbalanced Data)
2.3 기존 불균형 데이터 해결책
2.4 Semi-Hard Example Mining
Ⅲ. 연구 방법
3.1 연구 데이터
3.2 기존 증강 기법 구현
3.3 제안 기법:VAE-GAN+Semi-Hard Example Mining
3.4 모델 학습 및 평가 절차
Ⅳ. 연구 결과
4.1 모델별 성능 비교
4.2 Semi-Hard Example Mining 효과
Ⅴ. 결론
5.1 연구 결과 요약
5.2 학술적 시사점
5.3 실무적 시사점
5.4 한계점 및 개선 방향
참고문헌
Abstract

키워드

이상 거래 탐지(FDS) 불균형 데이터 오버샘플링 기법 VAE-GAN Semi-Hard Example Mining(SHEM) Fraud Detection System(FDS) Imbalanced Data Oversampling Technique VAE-GAN Semi-Hard Example Mining(SHEM)

저자

  • 강경태 [ Kyungtae Kang | 동아대학교 경영정보학과 석사과정 ]
  • 김성재 [ Sungjae Kim | 동아대학교 글로벌금융연구소 연구원 ]
  • 조용복 [ Yongbok Cho | 동아대학교 경영정보학과 조교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
    1989
  • 분야
    사회과학>경영학
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.

간행물

  • 간행물명
    경영정보학연구 [Information Systems Review]
  • 간기
    계간
  • pISSN
    2982-6551
  • eISSN
    2982-6837
  • 수록기간
    1999~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / 경영정보학연구 제27권 제3호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장