한국어 어절 자질들을 활용한 시퀀스 레이블링 기반 한국어 의존 구문 분석

조경철; 허윤석; 강상우

216.73.216.252

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

한국어 어절 자질들을 활용한 시퀀스 레이블링 기반 한국어 의존 구문 분석
Korean dependency parsing based on sequence labeling using Korean eojeol features

발행기관

한국차세대컴퓨팅학회 바로가기
간행물

한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
통권

Vol.17 No.2 (2021.04)바로가기
페이지

pp.7-18
저자

조경철, 허윤석, 강상우
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A396921

원문정보

초록

영어: Dependency parsing is a process of natural language understanding that extracts the relationships between the head and its dependent in a sentence, analyzing the grammatical structure of the sentence. Existing studies on Korean dependency parsing have limitations in that complex algorithms algorithms with high time complexity or additional data structures are inevitably required. Based on the rule of head final of Korean, in this paper, dependency parsing can be regarded as a sequence labelling problem that predicts the head and its dependent of each word in the input sentence. Then, we propose a novel Korean dependent parsing model that consists of an attention-based encoderdecoder framework which has been shown to be outstanding on prevailing sequence labeling tasks. In addition, we propose a method of applying several eojeol feature to korean dependency parsing. In order to effectively predict the head and its dependent label, we also describe labeling encoding methods based on the relative position of head using part-of-speech tags. As a result, the proposed model has proved to be effective compared with other baseline approaches.

한국어: 의존 구문 분석은 문장의 지배소와 의존소 간의 관계를 추출하고, 이를 통해 문장의 문법적 구조 분석을 하는 자연 어 이해의 한 과정이다. 기존의 한국어 의존 구문분석 연구들은 높은 시간 복잡도를 가지는 알고리즘이나 별도의 자 료구조가 필요하다는 한계점을 가지고 있다. 본 논문에서는 한국어의 지배소 후위의 법칙에 근거하여 의존 구문분석 문제를 어절단위 문장 입력에 대하여 각 어절이 입력 문장 내에서 의존관계를 가지는 지배소와 의존관계명을 예측하 는 시퀀스 레이블링 문제로 간주한다. 그리고 본 논문에서는 어텐션 기반의 인코더-디코더 프레임워크를 활용하여 기존 연구의 한계점을 모두 고려한 새로운 한국어 의존 구문분석 모델을 제안한다. 또한 본 논문에서 여러 한국어 어절자질들을 한국어 의존 구문 분석에 적용하는 방법을 제안한다. 또한 효과적인 지배소 및 의존관계명 예측을 위 해 본 논문에서는 형태소 태그를 활용한 지배소의 상대적 위치 기반 레이블 인코딩 방법을 제안한다. 결과적으로 다 른 기존 모델들과 비교하여 제안 방법이 효과적임을 확인하였다.

요약
Abstract
1. 서론
2. 관련연구
2.1 그래프 기반 구문 분석
2.2 전이 기반 구문 분석
2.3 시퀀스 레이블링 기반 구문 분석
3. 제안모델
3.1 인코더
3.2 디코더
4. 실험결과
4.1 학습 데이터
4.2 실험결과
5 결론
Acknowledgement
참고문헌
저자소개

키워드

자연어처리 의존 구문분석 딥러닝 시퀀스 레이블링 natural language processing dependency parsing deep learning sequence labeling

저자

조경철 [ Kyoungchul Cho | 가천대학교 IT융합공학과 ]
허윤석 [ Yoonseok Heo | 서강대학교 컴퓨터공학과 ]
강상우 [ Sangwoo Kang | 가천대학교 AI ․ 소프트웨어학부 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
설립연도
2005
분야
공학>컴퓨터학
소개
본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

간행물명

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
간기
격월간
pISSN
1975-681X
수록기간
2005~2026
등재여부
KCI 등재
십진분류
KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.17 No.2

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

한국어 어절 자질들을 활용한 시퀀스 레이블링 기반 한국어 의존 구문 분석
Korean dependency parsing based on sequence labeling using Korean eojeol features

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.17 No.2

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

한국어 어절 자질들을 활용한 시퀀스 레이블링 기반 한국어 의존 구문 분석 Korean dependency parsing based on sequence labeling using Korean eojeol features

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.17 No.2

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

한국어 어절 자질들을 활용한 시퀀스 레이블링 기반 한국어 의존 구문 분석
Korean dependency parsing based on sequence labeling using Korean eojeol features