This study investigates methods for applying deep learning to the analysis of historical Korean corpus. While contemporary Korean linguistics has widely adopted computational and digital humanities approaches, research on historical Korean has been limited by the complexity of older language forms and the scarcity of annotated data. Focusing on the National Institute of Korean Language’s Historical Korean Corpus, this research examines the construction status of the Sejong Corpus, extracts vernacular translations and original texts, and identifies the need to incorporate century-specific morphological characteristics. The study demonstrates that deep learning-based morphological analysis is feasible but requires both the expansion of training data and the refinement of model architectures to achieve accurate part-of-speech tagging. As one of the earliest attempts to integrate deep learning into historical Korean linguistics, this work highlights the potential for developing century-specific morphological models and for advancing the broader utilization of linguistic information in historical Korean corpus.
한국어
본고는 국어사 말뭉치의 구축 현황을 분석하고 국립국어원의 ‘국어 역사 말뭉치’를 대상으로 하여 딥러닝 시스템으로 형태 분석을 시도한 것이다. 현대 국어 연구와 달리 국어사 분야에서는 다양한 디지털 인문학적 방법론 적용에 한계가 있었다. 딥러닝 기반의 국어사 형태 분석을 위해 필요한 세종 말뭉치의 구축 현황을 분석하여 언해문과 원문을 추출하고 각 세기별 국어의 형태론적 특징을 반영할 필요성을 확인하였다. 정밀한 품사 태깅을 위해 학습 데이터의 확장과 모델 고도화가 요구되나 국어사 연구에 딥러닝 기술을 적용하여 형태 분석의 가능성을 모색한 시도로 세기별 형태 분석 모델의 개발과 국어사 정보의 활용을 위해 딥러닝을 활용한 초기 연구로 의의를 지닌다.
목차
요약 1. 서론 2. 국어사 말뭉치 구축 현황과 분석 3. 딥러닝을 활용한 말뭉치의 형태 분석 결과 4. 결론 참고문헌 Abstract
키워드
국어사 말뭉치딥러닝형태 분석디지털인문학Historical Korean corpusdeep learningmorphological analysisdigital humanities
국어사학회 [The Society of Korean Historical Linguistics]
설립연도
1997
분야
인문학>한국어와문학
소개
1997년 5월 10일에 ‘국어사자료학회’라는 이름으로 창립된 본 학회는 국어사와 관련된 자료를 발굴하고 연구하여 국어학 연구 제 분야의 발달에 기여하는 것을 목적으로 합니다. 학회의 주요 활동은 연구논문집 ≪국어사연구≫를 간행하며, 연 2회 학술 연구 발표회를 개최하는 것입니다. 또한 국어사 자료의 발굴, 조사, 정리, 영인, 출판, 국어사 자료의 정보화 및 기타 관련 사업들을 진행합니다.