Earticle

현재 위치 Home

How are Korean Neural Language Models ‘surprised’ Layerwisely?

첫 페이지 보기
  • 발행기관
    한국언어과학회 바로가기
  • 간행물
    언어과학 KCI 등재 바로가기
  • 통권
    제28권 4호 (2021.11)바로가기
  • 페이지
    pp.301-317
  • 저자
    Sunjoo Choi, Myung-Kwan Park, Euhee Kim
  • 언어
    영어(ENG)
  • URL
    https://www.earticle.net/Article/A403016

※ 기관로그인 시 무료 이용이 가능합니다.

5,100원

원문정보

초록

영어
Since the introduction of BERT, recent works have shown success in detecting when a word is anomalous given sentence context. Since likelihood score is not an appropriate tool in identifying the exact property of linguistic anomaly, Li et al. (2021) recently adopt Gaussian models for density estimation at intermediate layers of pretrained language models. They find that different English pretrained language models employ separate mechanisms to recognize different types of linguistic anomaly. In keeping with Li et al.‘s methodology, we probe whether Korean counterparts such as KoBERT and KR-BERT are sensitive to different levels of linguistic anomaly, just as English-based language models are. To investigate the issue concerned, we construct an experiment with a suite of test data involving morphosyntactic, semantic, and commonsense anomaly in Korean and apply the two Korean-based models to test relevant sentences. We find that KoBERT and KR-BERT show relatively higher surprisal gaps throughout layers when the anomaly is morphosyntactic than when the anomaly is semantic. By contrast, commonsense anomaly does not exhibit any surprisal gap in any layer. We thus report that, like their English counterparts, KoBERT and KR-BERT use different mechanisms to track the different types of linguistic anomaly.

목차

Abstract
1. Introduction
2. Related Works
2.1. Li et al. (2021)
3. Experimental Setup
3.1. Linguistic Datasets in Korean
3.2. Surprisal Gap
3.3. Adopted System
4. Results
5. Conclusion
References

키워드

한국어 신경망 언어모델 언어학적 변칙 ‘놀라움’ 차이 신경망 층별분석 KR-BERT KoBERT linguistic anomaly surprisal gap layerwise

저자

  • Sunjoo Choi [ Dongguk University/Research Professor ] First Author
  • Myung-Kwan Park [ Dongguk University/Professor ] Co-Corresponding Author
  • Euhee Kim [ Shinhan University/Professor ] Co-Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국언어과학회 [The Korean Association of Language Sciences]
  • 설립연도
    1993
  • 분야
    인문학>언어학
  • 소개
    한국언어과학회는 인간 사고에 대한 궁극적인 이해를 모태로 하여 그에 대한 구체적인 방법론을 제시하고, 인간 삶의 바람직한 사회적 행위를 이해하고 개선하는데 필요한 인간 중심의 언어학을 목표로하며, 언어의 이론적 연구와 그 응용을 목적으로 한다.

간행물

  • 간행물명
    언어과학 [Journal of Language Sciences]
  • 간기
    계간
  • pISSN
    1225-2522
  • 수록기간
    1994~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 705 DDC 405

이 권호 내 다른 논문 / 언어과학 제28권 4호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장