Earticle

현재 위치 Home

언어자원 자동 구축을 위한 위키피디아 콘텐츠 활용 방안 연구
A Study on Utilization of Wikipedia Contents for Automatic Construction of Linguistic Resources

첫 페이지 보기
  • 발행기관
    한국디지털정책학회 바로가기
  • 간행물
    디지털융복합연구 KCI 등재 바로가기
  • 통권
    제13권 제5호 (2015.05)바로가기
  • 페이지
    pp.187-194
  • 저자
    류철중, 윤보현, 김용
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A248953

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Various linguistic knowledge resources are required in order that machine can understand diverse variation in natural languages. This paper aims to devise an automatic construction method of linguistic resources by reflecting characteristics of online contents toward continuous expansion. Especially we focused to build NE(Named-Entity) dictionary because the applicability of NEs is very high in linguistic analysis processes. Based on the investigation on Korean Wikipedia, we suggested an efficient construction method of NE dictionary using the syntactic patterns and structural features such as metadatas.
한국어
급변하는 자연언어를 기계가 이해할 수 있도록 하기 위해서는 다양한 언어지식자원(linguistic knowledge resources)의 구축이 필수적으로 수반된다. 본 논문에서는 온라인 콘텐츠의 특성을 활용해 언어지식자원을 자동으로 구축함으로써 지속적으로 확장 가능한 방법을 고안하고자 한다. 특히 언어분석 과정에서 가장 활용도가 높은 개체명 (NE: Named Entity) 사전을 자동으로 구축, 확장하는데 주안점을 둔다. 이를 위해 본 논문에서는 개체명 사전 구축 대상문서로 위키피디아(Wikipedia)를 선정, 그 특성을 파악하기 위해 다양한 통계 분석을 수행하였다. 이에 기반하여 위키피디아 콘텐츠가 갖는 구문적 특성과 구조 정보 등의 메타데이터를 활용하여 개체명 사전을 구축, 확장하는 방 법을 제안한다.

목차

요약
 Abstract
 1. 서론
 2. 위키피디아 콘텐츠 특성 분석
 3. 개체명 사전 자동 구축을 위한 위키피디아 콘텐츠 활용
  3.1 Inner-info1: 해당 표제어의 설명 문장의 ‘패턴’활용
  3.2 Inner-info2: 해당 표제어의 정형화된 ‘구조정보’를 활용하는 방안
  3.3 Outer-info: 문서 간의 메타데이터 정보를 활용하는 방법
 4. 결론 및 향후 연구 방향
 ACKNOWLEDGMENTS
 REFERENCES

키워드

언어자원 구축 위키피디아 개체명 사전 지식구축 온라인 콘텐츠 활용 Linguistic Resource Construction Wikipedia Named-Entity Dictionary Knowledge Construction Utilization of online contents

저자

  • 류철중 [ Cheol-Jung Yoo | 전북대학교 소프트웨어공학과 ]
  • 김용 [ Yong Kim | 전북대학교 문헌정보학과 ]
  • 윤보현 [ Bo-Hyun Yun | 목원대학교 컴퓨터교육학과 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국디지털정책학회 [The Society of Digital Policy & Management]
  • 설립연도
    2003
  • 분야
    복합학>과학기술학
  • 소개
    디지털기술 및 산업정책, 디지털경제, 관련 산업의 연구, 전자정부, 디지털정치에 관한 제도적, 정책적 연구, 디지털경영, 전자상거래, e-비즈니스에 관한 실용적 연구, 학술연구지 발간 및 학술대회 개최 등을 통하여 디지털경제 및 디지털경영에 관련되는 국가정책 분야의 연구 및 교류를 촉진하고 국가 및 기업 정보화와 디지털산업의 발전에 공헌한다.

간행물

  • 간행물명
    디지털융복합연구 [Journal of Digital Convergence]
  • 간기
    계간
  • pISSN
    2713-6434
  • eISSN
    2713-6442
  • 수록기간
    2003~2026
  • 등재여부
    KCI 등재후보
  • 십진분류
    KDC 569 DDC 620

이 권호 내 다른 논문 / 디지털융복합연구 제13권 제5호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장