Earticle

현재 위치 Home

기술 융합(TC)

비정형 텍스트 테이터 분석을 위한 워드클라우드 기법에 관한 연구
A Study on Word Cloud Techniques for Analysis of Unstructured Text Data

첫 페이지 보기
  • 발행기관
    국제문화기술진흥원 바로가기
  • 간행물
    The Journal of the Convergence on Culture Technology (JCCT) KCI 등재 바로가기
  • 통권
    Vol.6 No.4 (2020.11)바로가기
  • 페이지
    pp.715-720
  • 저자
    이원조
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A386407

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

원문정보

초록

영어
In Big data analysis, text data is mostly unstructured and large-capacity, so analysis was difficult because analysis techniques were not established. Therefore, this study was conducted for the possibility of commercialization through verification of usefulness and problems when applying the big data word cloud technique, one of the text data analysis techniques. In this paper, the limitations and problems of this technique are derived through visualization analysis of the “President UN Speech” using the R program word cloud technique. In addition, by proposing an improved model to solve this problem, an efficient method for practical application of the word cloud technique is proposed.
한국어
빅데이터 분석에서 텍스트 데이터는 대부분 비정형이고 대용량으로 분석 기법이 정립되지 않아 분석에 어려움 이 많았다. 따라서 텍스트 데이터 분석 기법의 하나인 빅데이터 워드클라우드 기법의 실무 적용시 문제점과 유용성 검증을 통한 상용화 가능성을 위해 본 연구를 수행하였다. 본 논문에서는 R 프로그램 워드클라우드 기법을 이용하여 “대통령 UN연설문”을 시각화 분석을 하고 이 기법의 한계와 문제점을 도출한다. 그리고 이를 해결하기 위한 개선된 모델을 제안하여 워드클라우드 기법의 실무 적용에 대한 효율적인 방안을 제시한다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련연구
1. 비정형 데이터 분석
2. 워드클라우드 분석 기법
3. 텍스트 마이닝(Text Mining)
4. 웹 마이닝(Web Mining)
ⅡI. 비정형 텍스트 데이터 분석
1. 텍스트 데이터 분석 모델
2. 분석대상 문서 준비
3. 워드크라우드 작성
4. 명사 단어 추출
5. 빈도수 계산(상위 10단어 추출)
6. 워드클라우드 시각화 결과(후처리 전)
7. 워드클라우드 시각화 결과(후처리 후)
8. 워드클라우드 시각화 결과 분석
Ⅴ. 결론
References

키워드

빅데이터 비정형 데이터 텍스트 분석 워드클라우드 R 프로그램 시각화 Big data unstructured data text analysis word cloud R program visualization

저자

  • 이원조 [ Won-Jo Lee | 정회원, 울산과학대학교 안전및산업경영공학과 부교수 ] 제1저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제문화기술진흥원 [The International Promotion Agency of Culture Technology]
  • 설립연도
    2009
  • 분야
    공학>공학일반
  • 소개
    본 진흥원은 문화기술(Culture Technology) 관련 산·학·연·관으로 구성된 비영리 단체이다. 문화기술(CT)은 정보통신기술(ICT), 문화적 사고 기반의 예술, 인문학, 디자인, 사회과학기술이 접목된 신융합기술(New Convergence Technology, NCT)로 정의한다. 인간의 삶의 질을 향상시키고, 진보된 방향으로 변화시키고, 문화기술 관련 분야의 학술 및 기술의 발전과 진흥에 공헌하기 위하여, 제3조의 필요한 사업을 행함을 그 목적으로 한다.

간행물

  • 간행물명
    The Journal of the Convergence on Culture Technology (JCCT) [문화기술의 융합]
  • 간기
    격월간
  • pISSN
    2384-0358
  • eISSN
    2384-0366
  • 수록기간
    2015~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 600 DDC 700

이 권호 내 다른 논문 / The Journal of the Convergence on Culture Technology (JCCT) Vol.6 No.4

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장