국어사 말뭉치의 활용 현황과 향후 과제

허인영

216.73.217.72

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

기획논문

국어사 말뭉치의 활용 현황과 향후 과제
Improving the Construction and Utilization of Korean Historical Corpora

발행기관

국어사학회 바로가기
간행물

국어사연구 KCI 등재 바로가기
통권

제36호 (2023.04)바로가기
페이지

pp.111-143
저자

허인영
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A429736

※ 기관로그인 시 무료 이용이 가능합니다.

7,500원

원문정보

초록

영어: This paper examines the utilization of Korean historical corpora and provides perspectives on how to better utilize them, as well as considerations for future corpus construction. Compared to other humanities fields, computerization in the history of the Korean language has been relatively early, but the raw corpus has mainly been used for simple searching and dictionary compilation. In the future, it is necessary to actively construct and modify the corpora in accordance with international standards, without being constrained by space and time. In terms of utilization, the corpora should be used not only for research on the history of the Korean language and related fields, but also for creating information on lexical history, developing better tokenizers and concordancers, and training data for machine/deep learning. Finally, access to and use of the corpora should be open in terms of open science and open data.

한국어: 이 글에서는 국어사 말뭉치가 어떻게 활용되어 왔는지를 살펴보고, 앞으로 국어사 말뭉치를 구축하는 데 있어 고려해야 할 사항과 함께 국어사 말뭉치 활용 방안에 대 한 관견을 제시하고자 하였다. 인문학의 다른 분야에 비하면 국어사 분야의 전산화는 비교적 이른 편이었으나, 주로 원시말뭉치가 구축되었고 단순 검색이나 사전 편찬에 활용되는 데 그쳤다. 앞으로 구축에 있어서는 국제적인 표준에 의거하여, 시공간의 제 약을 받지 않는 방식으로 말뭉치의 구축과 보완이 활발하게 이루어져야 한다. 활용에 있어서는 국어사 및 인접분야 연구나 어휘역사정보 구축은 물론이고, 더 나은 형태소 분석기와 콘코던서의 개발, 머신러닝/딥러닝 학습 등을 위해 활용할 필요가 있다. 구 축․보완되는 말뭉치의 접근과 사용은 오픈 사이언스․오픈 데이터라는 관점에서 반드시 개방적으로 이루어져야 한다.

키워드

국어사 말뭉치 옛말사전 어휘역사정보 XML TEI 일본어역사말뭉치 오픈 사이언스 오픈 데이터 어듸메 kohico 광학문자인식 다언어언어모델 history of Korean language corpus pre-modern Korean dictionary information for lexical history XML TEI Corpus of Historical Japanese (CHJ) open science open data eoduime kohico optical character recognition (OCR) multilingual language model

저자

허인영 [ Heo, Inyeong | 인하대학교 한국어문학과 조교수 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

국어사학회 [The Society of Korean Historical Linguistics]
설립연도
1997
분야
인문학>한국어와문학
소개
1997년 5월 10일에 ‘국어사자료학회’라는 이름으로 창립된 본 학회는 국어사와 관련된 자료를 발굴하고 연구하여 국어학 연구 제 분야의 발달에 기여하는 것을 목적으로 합니다. 학회의 주요 활동은 연구논문집 ≪국어사연구≫를 간행하며, 연 2회 학술 연구 발표회를 개최하는 것입니다. 또한 국어사 자료의 발굴, 조사, 정리, 영인, 출판, 국어사 자료의 정보화 및 기타 관련 사업들을 진행합니다.

간행물

간행물명

국어사연구 [Korean Historical Linguistics]
간기
반년간
pISSN
1738-477X
수록기간
2000~2026
등재여부
KCI 등재
십진분류
KDC 710 DDC 492

이 권호 내 다른 논문 / 국어사연구 제36호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

국어사 말뭉치의 활용 현황과 향후 과제
Improving the Construction and Utilization of Korean Historical Corpora

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 국어사연구 제36호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

국어사 말뭉치의 활용 현황과 향후 과제 Improving the Construction and Utilization of Korean Historical Corpora

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 국어사연구 제36호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

국어사 말뭉치의 활용 현황과 향후 과제
Improving the Construction and Utilization of Korean Historical Corpora