Earticle

현재 위치 Home

한국어 어절 자질들을 활용한 시퀀스 레이블링 기반 한국어 의존 구문 분석
Korean dependency parsing based on sequence labeling using Korean eojeol features

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
  • 통권
    Vol.17 No.2 (2021.04)바로가기
  • 페이지
    pp.7-18
  • 저자
    조경철, 허윤석, 강상우
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A396921

원문정보

초록

영어
Dependency parsing is a process of natural language understanding that extracts the relationships between the head and its dependent in a sentence, analyzing the grammatical structure of the sentence. Existing studies on Korean dependency parsing have limitations in that complex algorithms algorithms with high time complexity or additional data structures are inevitably required. Based on the rule of head final of Korean, in this paper, dependency parsing can be regarded as a sequence labelling problem that predicts the head and its dependent of each word in the input sentence. Then, we propose a novel Korean dependent parsing model that consists of an attention-based encoderdecoder framework which has been shown to be outstanding on prevailing sequence labeling tasks. In addition, we propose a method of applying several eojeol feature to korean dependency parsing. In order to effectively predict the head and its dependent label, we also describe labeling encoding methods based on the relative position of head using part-of-speech tags. As a result, the proposed model has proved to be effective compared with other baseline approaches.
한국어
의존 구문 분석은 문장의 지배소와 의존소 간의 관계를 추출하고, 이를 통해 문장의 문법적 구조 분석을 하는 자연 어 이해의 한 과정이다. 기존의 한국어 의존 구문분석 연구들은 높은 시간 복잡도를 가지는 알고리즘이나 별도의 자 료구조가 필요하다는 한계점을 가지고 있다. 본 논문에서는 한국어의 지배소 후위의 법칙에 근거하여 의존 구문분석 문제를 어절단위 문장 입력에 대하여 각 어절이 입력 문장 내에서 의존관계를 가지는 지배소와 의존관계명을 예측하 는 시퀀스 레이블링 문제로 간주한다. 그리고 본 논문에서는 어텐션 기반의 인코더-디코더 프레임워크를 활용하여 기존 연구의 한계점을 모두 고려한 새로운 한국어 의존 구문분석 모델을 제안한다. 또한 본 논문에서 여러 한국어 어절자질들을 한국어 의존 구문 분석에 적용하는 방법을 제안한다. 또한 효과적인 지배소 및 의존관계명 예측을 위 해 본 논문에서는 형태소 태그를 활용한 지배소의 상대적 위치 기반 레이블 인코딩 방법을 제안한다. 결과적으로 다 른 기존 모델들과 비교하여 제안 방법이 효과적임을 확인하였다.

목차

요약
Abstract
1. 서론
2. 관련연구
2.1 그래프 기반 구문 분석
2.2 전이 기반 구문 분석
2.3 시퀀스 레이블링 기반 구문 분석
3. 제안모델
3.1 인코더
3.2 디코더
4. 실험결과
4.1 학습 데이터
4.2 실험결과
5 결론
Acknowledgement
참고문헌
저자소개

키워드

자연어처리 의존 구문분석 딥러닝 시퀀스 레이블링 natural language processing dependency parsing deep learning sequence labeling

저자

  • 조경철 [ Kyoungchul Cho | 가천대학교 IT융합공학과 ]
  • 허윤석 [ Yoonseok Heo | 서강대학교 컴퓨터공학과 ]
  • 강상우 [ Sangwoo Kang | 가천대학교 AI ․ 소프트웨어학부 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.17 No.2

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장