In this paper, we present two deterministic Korean dependency parsing algorithms using support vector machine. We modify the forward algorithm proposed first by Kudo(2002) and propose the new backward algorithm. It's well-known fact that backward parsing is more effective in head-final languages. We use proper features to train parsing models for Korean that has a complex word form (eojeol in Korean), an ellipsis possibility of constituents, and so on. In the experiment for Korean Language Information Base System (KIBS) corpus, we achieve 88.25% dependency accuracy that is state-of-the-art performance. It means that proposed methods outperform previous statistical parsing methods and deterministic parsing algorithm is also suitable to Korean parsing.
목차
Abstract 1. 서론 2. 관련 연구 3. 한국어 의존 구문분석 3.1 SVM(Support Vector Machine) 3.2 SVM을 이용한 결정적 한국어 의존 구문분석 3.3 한국어 의존 구문분석을 위한 문맥 자질 집합 4. 실험 결과 및 분석 4.1 실험 데이터 4.2 실험 결과 및 분석 4.3 기존 연구와의 성능 비교 5. 결론 및 향후 연구 참고문헌
한국어정보학회 [Korean Language Information Science Society]
설립연도
1990
분야
인문학>언어학
소개
학술적인 연구를 통하여 국어정보처리에 관련된 이론 체계를 정립하고, 산업계와의 긴밀한 협동을 통하여 정보처리 기술을 향상 시키면서 정보산업의 성장을 돕고, 대중적인 교육과 홍보를 통하여 발전된 정보 처리의 기술을 보급하므로써 국어의 문화적 가치를 높히고 국어정보 처리 기술의 국제적 지위향상과 표준화에 기여하고자 합니다.