Earticle

현재 위치 Home

Convergence of Internet, Broadcasting and Communication

빅데이터 기반 문서 토픽 추출 시스템 연구
A Study on the Document Topic Extraction System Based on Big Data

첫 페이지 보기
  • 발행기관
    국제인공지능학회(구 한국인터넷방송통신학회) 바로가기
  • 간행물
    한국인터넷방송통신학회 논문지 KCI 등재 바로가기
  • 통권
    제20권 제5호 (2020.10)바로가기
  • 페이지
    pp.207-214
  • 저자
    황승연, 안윤빈, 신동진, 오재곤, 문진용, 김정준
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A384076

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

원문정보

초록

영어
Nowadays, the use of smart phones and various electronic devices is increasing, the Internet and SNS are activated, and we live in the flood of information. The amount of information has grown exponentially, making it difficult to look at a lot of information, and more and more people want to see only key keywords in a document, and the importance of research to extract topics that are the core of information is increasing. In addition, it is also an important issue to extract the topic and compare it with the past to infer the current trend. Topic modeling techniques can be used to extract topics from a large volume of documents, and these extracted topics can be used in various fields such as trend prediction and data analysis. In this paper, we inquire the topic of the three-year papers of 2016, 2017, and 2018 in the field of computing using the LDA algorithm, one of Probabilistic Topic Model Techniques, in order to analyze the rapidly changing trends and keep pace with the times. Then we analyze trends and flows of research.
한국어
요즘 스마트폰, 각종 전자기기 등의 사용이 늘고, 인터넷과 SNS가 활성화되며 우리는 정보의 홍수 속에 살고 있다. 정보의 양이 기하급수적으로 증가하며 많은 정보를 다 살펴보는 것이 어려워졌고, 문서에서 핵심 키워드만 보기를 원하는 사람이 늘어나며 정보의 핵심이 되는 토픽을 추출하는 연구의 중요성이 증가하고 있다. 또한, 토픽을 추출하여 과거와 비교 분석하여 현재의 트렌드를 유추해내는 것도 최근 중요한 이슈이다. 토픽 모델링 기법을 이용하여 대량의 문서에서 토픽을 추출해낼 수 있으며, 이렇게 추출된 토픽은 트렌드 예측, 데이터 분석 등 다양한 분야에서 쓰일 수 있다. 본 논문에서는 빠르게 변하는 트렌드를 분석하여 시대의 흐름에 맞춰가기 위해 확률적 토픽 모델 기법의 하나인 LDA 알고리즘을 활용하였으며, 문서에서 컴퓨팅 분야의 2016, 2017, 2018년도 3개년 논문의 주제를 알아보고, 연구의 동향 과 흐름을 분석한다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. LDA
1. LDA의 개념
2. LDA의 핵심 가정
3. 깁스 샘플링
4. LDA의 과정
Ⅲ. 시스템 구조 및 상세 프로세스
1. 빅데이터 처리 프로세스
2. 빅데이터 분석 프로세스
3. 웹 시각화 프로세스
Ⅳ. 결론
References

키워드

Big Data Data Analysis LDA Topic Modeling Data Mining

저자

  • 황승연 [ Seung-Yeon Hwang | 준회원, 안양대학교 컴퓨터공학과 석사과정 ]
  • 안윤빈 [ Yoon-Bin An | 준회원, 한국산업기술대학교 컴퓨터공학과 학부생 ]
  • 신동진 [ Dong-Jin Shin | 준회원, 안양대학교 컴퓨터공학과 박사과정 ]
  • 오재곤 [ Oh Jae-Kon | 정회원, ㈜진우산전 이사 ]
  • 문진용 [ Jin Yong Moon | 정회원, 강동대학교 방송영상미디어과 교수 ]
  • 김정준 [ Jeong-Joon Kim | 정회원, 안양대학교 ICT융합학부 소프트웨어전공 교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제인공지능학회(구 한국인터넷방송통신학회) [The International Association for Artificial Intelligence]
  • 설립연도
    2000
  • 분야
    공학>전자/정보통신공학
  • 소개
    인터넷방송, 인터넷 TV , 방송 통신 네트워크 및 관련 분야에 대한 국내는 물론 국제적인 학술, 기술의 진흥발전에 공헌하고 지식 정보화 사회에 기여하고자 한다.

간행물

  • 간행물명
    한국인터넷방송통신학회 논문지 [The Journal of the Institute of Internet, Broadcasting and Communication]
  • 간기
    격월간
  • pISSN
    2289-0238
  • eISSN
    2289-0246
  • 수록기간
    2001~2025
  • 십진분류
    KDC 326 DDC 380

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제20권 제5호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장