Earticle

현재 위치 Home

[Articles]

대용량 코퍼스 전산적 툴에 대한 연구
A Study on the Computing Tools for the Large Scale Corpus.

첫 페이지 보기
  • 발행기관
    한국코퍼스언어학회 바로가기
  • 간행물
    Corpus Linguistics Research KCI 등재후보 바로가기
  • 통권
    Vol. 6 No. 1 (2020.06)바로가기
  • 페이지
    pp.45-63
  • 저자
    김동성
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A379187

※ 기관로그인 시 무료 이용이 가능합니다.

5,400원

원문정보

초록

영어
Since corpus is a pile of everyday language usage, using computing tools is essential in collecting, sifting, mining and using the meaningful data from the massive text data. In this paper, we introduce two tools for handling the large scale corpus; IMS Corpus Workbench (CWB) and Sketch Engine. The architecture of the tools is the inverted index model as a type of reference database, providing corpus handlers with speed and extendibility. The limit of CWB lies in the Western language character unicode system (ISO-8859), causing unsatisfactory handling of Korean in the full-fledged scale. We need to consider more suitable architectural design for searching, storing and user-friendly interface in case of large scale corpus in Korean.

목차

ABSTRACT
1. 서론
2. 대용량 코퍼스 툴
2.1 CWB
2.2. Sketch Engine
3. 활용 연구
3.1. 코퍼스 데이터 시각화
3.2. Perl 코퍼스 검색과 비교
4. 한국어와 대용량 코퍼스 툴
5. 결론
참고문헌

키워드

Corpus IMS Corpus Workbench Sketch Engine Big Data Encoding

저자

  • 김동성 [ 이화여자대학교 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국코퍼스언어학회 [Korean Association for Corpus Linguistics]
  • 설립연도
    2012
  • 분야
    인문학>언어학
  • 소개
    본 학회는 코퍼스를 연구하거나 코퍼스를 사용하여 언어학 현상을 설명하고자 하는 연구자들로 구성된 학회이며, 코퍼스를 활용하여 다양한 언어현상을 설명하는 것을 설립목적으로 한다.

간행물

  • 간행물명
    Corpus Linguistics Research
  • 간기
    계간
  • pISSN
    2465-812X
  • 수록기간
    2015~2025
  • 십진분류
    KDC 701 DDC 410

이 권호 내 다른 논문 / Corpus Linguistics Research Vol. 6 No. 1

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장