Earticle

현재 위치 Home

기획논문

국어사 말뭉치의 활용 현황과 향후 과제
Improving the Construction and Utilization of Korean Historical Corpora

첫 페이지 보기
  • 발행기관
    국어사학회 바로가기
  • 간행물
    국어사연구 KCI 등재 바로가기
  • 통권
    제36호 (2023.04)바로가기
  • 페이지
    pp.111-143
  • 저자
    허인영
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A429736

※ 기관로그인 시 무료 이용이 가능합니다.

7,500원

원문정보

초록

영어
This paper examines the utilization of Korean historical corpora and provides perspectives on how to better utilize them, as well as considerations for future corpus construction. Compared to other humanities fields, computerization in the history of the Korean language has been relatively early, but the raw corpus has mainly been used for simple searching and dictionary compilation. In the future, it is necessary to actively construct and modify the corpora in accordance with international standards, without being constrained by space and time. In terms of utilization, the corpora should be used not only for research on the history of the Korean language and related fields, but also for creating information on lexical history, developing better tokenizers and concordancers, and training data for machine/deep learning. Finally, access to and use of the corpora should be open in terms of open science and open data.
한국어
이 글에서는 국어사 말뭉치가 어떻게 활용되어 왔는지를 살펴보고, 앞으로 국어사 말뭉치를 구축하는 데 있어 고려해야 할 사항과 함께 국어사 말뭉치 활용 방안에 대 한 관견을 제시하고자 하였다. 인문학의 다른 분야에 비하면 국어사 분야의 전산화는 비교적 이른 편이었으나, 주로 원시말뭉치가 구축되었고 단순 검색이나 사전 편찬에 활용되는 데 그쳤다. 앞으로 구축에 있어서는 국제적인 표준에 의거하여, 시공간의 제 약을 받지 않는 방식으로 말뭉치의 구축과 보완이 활발하게 이루어져야 한다. 활용에 있어서는 국어사 및 인접분야 연구나 어휘역사정보 구축은 물론이고, 더 나은 형태소 분석기와 콘코던서의 개발, 머신러닝/딥러닝 학습 등을 위해 활용할 필요가 있다. 구 축․보완되는 말뭉치의 접근과 사용은 오픈 사이언스․오픈 데이터라는 관점에서 반드시 개방적으로 이루어져야 한다.

목차

요약
1. 머리말
2. 국어사 말뭉치의 활용 현황
3. 국어사 말뭉치 활용의 선결 과제
4. 국어사 말뭉치의 활용 방안
5. 맺음말
참고문헌
Abstract

키워드

국어사 말뭉치 옛말사전 어휘역사정보 XML TEI 일본어역사말뭉치 오픈 사이언스 오픈 데이터 어듸메 kohico 광학문자인식 다언어언어모델 history of Korean language corpus pre-modern Korean dictionary information for lexical history XML TEI Corpus of Historical Japanese (CHJ) open science open data eoduime kohico optical character recognition (OCR) multilingual language model

저자

  • 허인영 [ Heo, Inyeong | 인하대학교 한국어문학과 조교수 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국어사학회 [The Society of Korean Historical Linguistics]
  • 설립연도
    1997
  • 분야
    인문학>한국어와문학
  • 소개
    1997년 5월 10일에 ‘국어사자료학회’라는 이름으로 창립된 본 학회는 국어사와 관련된 자료를 발굴하고 연구하여 국어학 연구 제 분야의 발달에 기여하는 것을 목적으로 합니다. 학회의 주요 활동은 연구논문집 ≪국어사연구≫를 간행하며, 연 2회 학술 연구 발표회를 개최하는 것입니다. 또한 국어사 자료의 발굴, 조사, 정리, 영인, 출판, 국어사 자료의 정보화 및 기타 관련 사업들을 진행합니다.

간행물

  • 간행물명
    국어사연구 [Korean Historical Linguistics]
  • 간기
    반년간
  • pISSN
    1738-477X
  • 수록기간
    2000~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 710 DDC 492

이 권호 내 다른 논문 / 국어사연구 제36호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장