Earticle

TF-IDF를 이용한 군집분석 연구

  • 간행물
    한국경영정보학회 정기 학술대회 바로가기
  • 권호(발행년)
    2019년 경영정보관련 춘계학술대회 (2019.05) 바로가기
  • 페이지
    pp.380-384
  • 저자
    이종화, 김종원
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A353996

원문정보

초록

한국어
기업에서 정보시스템 영역이 확장되는 이유 중 하나는 늘어나는 데이터 분석에 효율성이 높기 때문이다. 특히, 급속히 증가하는 데이터의 형태에는 영상, 음성, 이미지, 소셜네트워크에서 오고 가는 대화 등과 같이 복잡하고 대용량적인 비정형적 데이터가 양적인 증가를 주도하고 있다. 웹 환경에 있는 고객의 소리 즉, 텍스트 데이터들의 분석이 고객의 니즈 분석에 많은 연구가 이루어지며 대부분 텍스트마이닝 기반 분석이다. 단어의 빈도를 기준으로 분석이 이루어 지다 보니 문장의 단어 빈도가 그 문장을 해석하는 단어로 추출되며 연구 결과에서 영향을 주고 있다. 본 연구는 문장에서 빈도만으로 문장을 대표하는 단어 추출이 아닌 실제 문장에서 중요한 키워드를 추출하는 TF-IDF 기법을 이용하여 군집분석을 통하여 빈도 중심의 분석 기법과 비교하여 그 차이를 기술하고자 한다.

목차

Abstract
I. 서론
II. 이론적 배경
1. TF(Term Frequency)
2. TF-IDF(Term Frequency-Inverse Document Frequency)
3. Cluster Analysis
III. 연구 방법
IV. 결론
참고문헌

저자

  • 이종화 [ 동의대학교 상경대학 정보경영학부 시간강사 ]
  • 김종원 [ 동의대학교 상경대학 정보경영학부 교수 ]

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국경영정보학회 정기 학술대회 [KMIS Conference]
    • 간기
      반년간
    • 수록기간
      1990~2025
    • 십진분류
      KDC 325 DDC 658