빅데이터 기반 문서 토픽 추출 시스템 연구

황승연; 안윤빈; 신동진; 오재곤; 문진용; 김정준

216.73.216.134

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

Convergence of Internet, Broadcasting and Communication

빅데이터 기반 문서 토픽 추출 시스템 연구
A Study on the Document Topic Extraction System Based on Big Data

발행기관

국제인공지능학회(구 한국인터넷방송통신학회) 바로가기
간행물

한국인터넷방송통신학회 논문지 KCI 등재 바로가기
통권

제20권 제5호 (2020.10)바로가기
페이지

pp.207-214
저자

황승연, 안윤빈, 신동진, 오재곤, 문진용, 김정준
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A384076

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

원문정보

초록

영어: Nowadays, the use of smart phones and various electronic devices is increasing, the Internet and SNS are activated, and we live in the flood of information. The amount of information has grown exponentially, making it difficult to look at a lot of information, and more and more people want to see only key keywords in a document, and the importance of research to extract topics that are the core of information is increasing. In addition, it is also an important issue to extract the topic and compare it with the past to infer the current trend. Topic modeling techniques can be used to extract topics from a large volume of documents, and these extracted topics can be used in various fields such as trend prediction and data analysis. In this paper, we inquire the topic of the three-year papers of 2016, 2017, and 2018 in the field of computing using the LDA algorithm, one of Probabilistic Topic Model Techniques, in order to analyze the rapidly changing trends and keep pace with the times. Then we analyze trends and flows of research.

한국어: 요즘 스마트폰, 각종 전자기기 등의 사용이 늘고, 인터넷과 SNS가 활성화되며 우리는 정보의 홍수 속에 살고 있다. 정보의 양이 기하급수적으로 증가하며 많은 정보를 다 살펴보는 것이 어려워졌고, 문서에서 핵심 키워드만 보기를 원하는 사람이 늘어나며 정보의 핵심이 되는 토픽을 추출하는 연구의 중요성이 증가하고 있다. 또한, 토픽을 추출하여 과거와 비교 분석하여 현재의 트렌드를 유추해내는 것도 최근 중요한 이슈이다. 토픽 모델링 기법을 이용하여 대량의 문서에서 토픽을 추출해낼 수 있으며, 이렇게 추출된 토픽은 트렌드 예측, 데이터 분석 등 다양한 분야에서 쓰일 수 있다. 본 논문에서는 빠르게 변하는 트렌드를 분석하여 시대의 흐름에 맞춰가기 위해 확률적 토픽 모델 기법의 하나인 LDA 알고리즘을 활용하였으며, 문서에서 컴퓨팅 분야의 2016, 2017, 2018년도 3개년 논문의 주제를 알아보고, 연구의 동향 과 흐름을 분석한다.

키워드

Big Data Data Analysis LDA Topic Modeling Data Mining

저자

황승연 [ Seung-Yeon Hwang | 준회원, 안양대학교 컴퓨터공학과 석사과정 ]
안윤빈 [ Yoon-Bin An | 준회원, 한국산업기술대학교 컴퓨터공학과 학부생 ]
신동진 [ Dong-Jin Shin | 준회원, 안양대학교 컴퓨터공학과 박사과정 ]
오재곤 [ Oh Jae-Kon | 정회원, ㈜진우산전 이사 ]
문진용 [ Jin Yong Moon | 정회원, 강동대학교 방송영상미디어과 교수 ]
김정준 [ Jeong-Joon Kim | 정회원, 안양대학교 ICT융합학부 소프트웨어전공 교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

국제인공지능학회(구 한국인터넷방송통신학회) [The International Association for Artificial Intelligence]
설립연도
2000
분야
공학>전자/정보통신공학
소개
인터넷방송, 인터넷 TV , 방송 통신 네트워크 및 관련 분야에 대한 국내는 물론 국제적인 학술, 기술의 진흥발전에 공헌하고 지식 정보화 사회에 기여하고자 한다.

간행물

간행물명

한국인터넷방송통신학회 논문지 [The Journal of the Institute of Internet, Broadcasting and Communication]
간기
격월간
pISSN
2289-0238
eISSN
2289-0246
수록기간
2001~2025
십진분류
KDC 326 DDC 380

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제20권 제5호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

빅데이터 기반 문서 토픽 추출 시스템 연구
A Study on the Document Topic Extraction System Based on Big Data

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제20권 제5호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

빅데이터 기반 문서 토픽 추출 시스템 연구 A Study on the Document Topic Extraction System Based on Big Data

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제20권 제5호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

빅데이터 기반 문서 토픽 추출 시스템 연구
A Study on the Document Topic Extraction System Based on Big Data