Earticle

현재 위치 Home

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템
A System for Automatic Classification of Traditional Culture Texts

첫 페이지 보기
  • 발행기관
    한국융합학회 바로가기
  • 간행물
    한국융합학회논문지 KCI 등재 바로가기
  • 통권
    제8권 제12호 (2017.12)바로가기
  • 페이지
    pp.39-47
  • 저자
    허윤아, 이동엽, 김규경, 유원희, 임희석
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A317608

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
The Internet have increased the number of digital web documents related to the history and traditions of Korean Culture. However, users who search for creators or materials related to traditional cultures are not able to get the information they want and the results are not enough. Document classification is required to access this effective information. In the past, document classification has been difficult to manually and manually classify documents, but it has recently been difficult to spend a lot of time and money. Therefore, this paper develops an automatic text classification model of traditional cultural contents based on the data of the Korean information culture field composed of systematic classifications of traditional cultural contents. This study applied TF-IDF model, Bag-of-Words model, and TF-IDF/Bag-of-Words combined model to extract word frequencies for 'Korea Traditional Culture' data. And we developed the automatic text classification model of traditional cultural contents using Support Vector Machine classification algorithm.
한국어
한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

목차

요약
 Abstract
 1. 서론
 2. 관련연구
  2.1 텍스트 분류
 3. 연구방법
  3.1 연구 자료
  3.2 연구 방법
  3.3 데이터 전처리
 4. 연구 결과
  4.1 TF-IDF
  4.2 Bag-of-Words
  4.3 지도 학습
  4.4 SVM 알고리즘
 5. 결론
 ACKNOWLEDGMENTS
 REFERENCES

키워드

텍스트 분류 빅데이터 지도 학습 기계학습 자연어처리 Text Classification Big Data Supervised Learning Machine Learning Natural Language Processing

저자

  • 허윤아 [ YunA Hur | 고려대학교 컴퓨터학과 ]
  • 이동엽 [ DongYub Lee | 고려대학교 컴퓨터학과 ]
  • 김규경 [ Kuekyeng Kim | 고려대학교 컴퓨터학과 ]
  • 유원희 [ Wonhee Yu | 고려대학교 컴퓨터학과 ]
  • 임희석 [ HeuiSeok Lim | 고려대학교 컴퓨터학과 ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국융합학회 [Korea Convergence Society]
  • 설립연도
    2011
  • 분야
    복합학>학제간연구
  • 소개
    본회는 융합학문 및 융합기술을 교류를 통한 학문기술의 확대․발전․보급 및 기술개발 전략에 과학적으로 접근하여 융합학문 및 기술을 더욱 활성화하고, 회원 상호간의 정보 교류를 도모함으로써 지역과 나라발전에 기여함을 목적으로 한다.

간행물

  • 간행물명
    한국융합학회논문지 [Journal of the Korea Convergence Society]
  • 간기
    월간
  • pISSN
    2233-4890
  • 수록기간
    2010~2022
  • 십진분류
    KDC 530 DDC 620

이 권호 내 다른 논문 / 한국융합학회논문지 제8권 제12호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장