Earticle

다운로드

클래스 불균형 데이터의 분류 성능 향상을 위한 언어 증강과 Focal loss 를 활용한 Supervised Contrastive Learning 모델
Supervised Contrastive Learning Model using Language Augmentation and Focal Loss to Improve Classification Performance of Class Imbalanced Data

  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 권호(발행년)
    2023 한국차세대컴퓨팅학회 춘계학술대회 (2023.06) 바로가기
  • 페이지
    pp.72-75
  • 저자
    곽진희, 정재희
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A433514

원문정보

초록

한국어
소셜미디어의 발달로 인하여 즉각적인 소통이 활발해졌지만, 혐오표현이 유발하는 차별행위가 늘어남에 따라 혐오표현을 필터링하는 연구의 필요성이 제기되고 있다. 혐오표현은 다양한 카테고리로 구분되지만, 카테고리별로 균형 잡힌 데이터셋을 구축하기에는 어려움이 존재한다. 따라서 본 연구에서는 데이터 증강을 적용하여 혐오표현 분류 성능을 향상시킨 모델을 제시한다. Easy data augmentation techniques를 적용하여 최소 규모의 카테고리 데이터를 증강하였다. Kcbert-base 모델에 focal loss와 supervised contrastive learning을 적용하여, 동일 카테고리의 문장 유사도는 높이고, 다른 카테고리와의 문장 유사도는 낮추면서 모델을 학습시켰다. 실험 결과 증강과 focal loss를 적용하지 않은 모델에 비해 easy data augmentation techniques와 focal loss, supervised contrastive learning을 적용한 모델의 평균 정확도는 1.4%, macro f1-score는 4.4% 우수한 것을 확인하였다.

목차

요약
1. 서론
2. 관련연구
2.1 데이터 증강
2.2 Focal Loss
3. 실험방법
3.1. 데이터셋
3.2 실험환경
3.3 실험내용
4. 실험결과
5. 결론
참고문헌

저자

  • 곽진희 [ 정보통신공학과 명지대학교 ]
  • 정재희 [ 정보통신공학과 명지대학교 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국차세대컴퓨팅학회 학술대회
    • 간기
      반년간
    • 수록기간
      2021~2025
    • 십진분류
      KDC 566 DDC 004