Earticle

현재 위치 Home

기획논문

개화기 국어 말뭉치 구축 현황과 개선 방안 연구
A Study on the Status of Korean Corpus Establishment in the Modernization Period and Plan for Improvement

첫 페이지 보기
  • 발행기관
    국어사학회 바로가기
  • 간행물
    국어사연구 KCI 등재 바로가기
  • 통권
    제36호 (2023.04)바로가기
  • 페이지
    pp.69-109
  • 저자
    김진해
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A429735

※ 기관로그인 시 무료 이용이 가능합니다.

8,700원

원문정보

초록

영어
The purpose of this study is to reveal the status of Korean corpus establishment in the modernization period and measures for improvement. Up until now, the corpus in the modernization period has been accumulated separately to some extent; however, it is difficult to analyze and utilize it profoundly because the data are not consistent and compatible, and also, most data are unreleased, and even if they are opened, only search results can be viewed. To solve this problem, first, it is necessary to prepare common information and input guidelines that must be included when a corpus is built. In particular, principles on spacing or processing Chinese characters should be established. In order to build a tagged corpus, too, it is necessary to present both old and modern forms of words to increase user convenience for researchers. Macroscopically, to computerize language data in a specific genre among research groups as much as possible, it is needed to build up a system for task division and cooperation and seek methodology to establish a balanced corpus by period and by genre. Particularly, there is an urgent need to establish a platform to share data according to the principle of reciprocity.
한국어
이 연구는 개화기 국어 말뭉치 구축 현황과 개선 방안을 밝히는 것을 목적으로 한 다. 그 동안 개화기 말뭉치도 어느 정도의 규모가 개별적으로 축적되었지만, 자료 간 의 일관성과 호환성이 떨어지고 대부분의 자료가 미공개되거나 공개되더라도 검색 결 과만을 볼 수 있어 개화기 말뭉치에 대한 다양한 분석과 활용이 어렵다. 이를 극복하기 위해서는 다양한 장르를 대상으로 한 말뭉치 구축 지침을 마련해야 한다. 특히, 띄어쓰기 및 한자 처리에 대한 원칙 마련이 시급하다. 주석말뭉치 구축을 위해서도 다양한 장르를 대상으로 하되, 연구자들의 이용의 편이성을 높이기 위해 고 어형과 현대어형을 동시에 제시할 필요가 있다. 거시적으로는 연구 그룹 간 특정 장 르(신문, 잡지, 신소설, 교과서 등)의 언어 자료를 최대한 발굴․전산화하기 위한 분업 및 협업 체계 수립, 개화기 국어 말뭉치 구축 시 반드시 포함해야 할 공통 정보 및 입 력 지침 마련, 시기별․장르별 균형 말뭉치 구축 방법론 모색 등이 이루어져야 한다. 특히, 상호주의적 원칙에 따라 자료를 공유할 수 있는 플랫폼 구축이 절실히 필요하다.

목차

요약
1. 서론
2. 본론
3. 결론
참고문헌
Abstract

키워드

개화기 국어 말뭉치 원시 말뭉치 주석말뭉치 균형말뭉치 형태분석 프로그램 corpus of modernization period of Korea raw corpus tagged corpus balanced corpus tagger

저자

  • 김진해 [ Kim, Jinhae | 경희대학교 후마니타스칼리지 교수 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국어사학회 [The Society of Korean Historical Linguistics]
  • 설립연도
    1997
  • 분야
    인문학>한국어와문학
  • 소개
    1997년 5월 10일에 ‘국어사자료학회’라는 이름으로 창립된 본 학회는 국어사와 관련된 자료를 발굴하고 연구하여 국어학 연구 제 분야의 발달에 기여하는 것을 목적으로 합니다. 학회의 주요 활동은 연구논문집 ≪국어사연구≫를 간행하며, 연 2회 학술 연구 발표회를 개최하는 것입니다. 또한 국어사 자료의 발굴, 조사, 정리, 영인, 출판, 국어사 자료의 정보화 및 기타 관련 사업들을 진행합니다.

간행물

  • 간행물명
    국어사연구 [Korean Historical Linguistics]
  • 간기
    반년간
  • pISSN
    1738-477X
  • 수록기간
    2000~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 710 DDC 492

이 권호 내 다른 논문 / 국어사연구 제36호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장