Earticle

현재 위치 Home

Session 2 인공지능

다중 손실 함수를 활용한 문장 유사도 성능 향상 기법
Imporving Semantic Textual Similarity Performance Using Multiple Loss Function

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 통권
    2021 한국차세대컴퓨팅학회 춘계학술대회 (2021.05)바로가기
  • 페이지
    pp.63-66
  • 저자
    JaeJin Seo, WonIk Choi
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A409326

원문정보

초록

한국어
본 논문에서는 추가적인 데이터의 수집 없이 STS(Semantic Textual Similarity) task에서 multiple loss와 label smoothing 기법을 활용하여 성능을 향상시키는 방법을 제안한다. 기존의 모델들은 3-way softmax loss또는 cosine-similarity with MSE loss를 활용하여 STS task에 대한 손실 함숫값으로 계산하기 때문에, 사전 훈련된 언어 모델의 Word Contextual Embedding Vector가 좋지 않은 방향으로 변할 수 있는 문제점이 있다. 따라서 softmax loss에 label Smoothing 기법을 활용하여 유사한 문장끼리 클러스터링이 되도록 학습을 하였으며, 사전 언어 모델 중의 하나인 GPT(Generative Pre-training)에서 사전 훈련을 할 때 이용했던 loss 계산 방식에서 아이디어를 얻어 새로운 loss를 제안하는 모델에 결합하여 활용하였다. 이 2가지 접근 방식은 fine-tuning시에 활용하여 성능을 향상시킨다. 사전 훈련에는 Multi-genre Natural Language Inference, Stanford Natural Language Inference 데이터를 이용하였으며, 모델을 평가하기 위한 데이터로는 Semantic Textual Similarity benchmark를 이용하였다. 평균적으로 1.24% 정도의 성능 향상을 보였으며, Spearman’s rank에서는 최대 4.67%, Pearson correlation coefficient에서는 최대 5.64%의 성능 향상을 보였다.

목차

Abstract
1. Introduction
2. Related Works
3. Model
3.1. Data Set
3.2. Training
4. Experiments
4.1 Label Smoothing Effect
4.2 Word Predict Loss Effect
4.3 CNN Network Effect
4.4 제안한 기법의 결과 비교
4.5 최종 성능 비교
5. Conclusions
Acknowledgement
References

키워드

Natural Language Processing (NLP) BERT Sentence Embedding Semantic Textual Similarity Task

저자

  • JaeJin Seo [ Electrical and Computer Engineering Inha University Incheon, South Korea ]
  • WonIk Choi [ Electrical and Computer Engineering Inha University Incheon, South Korea ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 학술대회
  • 간기
    반년간
  • 수록기간
    2021~2025
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2021 한국차세대컴퓨팅학회 춘계학술대회

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장