This study applies text mining techniques to NAVER News data, focusing on the keyword 'algorithm'. The aim was to identify and analyze the major trends and topics related to 'algorithm' within the news data. The process involved data collection, preprocessing, feature vectorization, and topic modeling.Data collection was performed using the NAVER API, targeting news articles that contained the keyword 'algorithm'. The collected data underwent text preprocessing to transform it into a format suitable for analysis. Subsequently, feature vectorization converted the text data into a numerical form that machine learning algorithms can process. Topic modeling techniques, such as LDA and LSA, were applied to extract and analyze the main topics.The analysis revealed that the keyword 'algorithm' holds significant importance across various news topics. Notably, topics related to technological advancements, societal impact, and business strategies were predominantly featured. This research demonstrates the effectiveness of text mining techniques in identifying and understanding trends and topics associated with algorithms in news content.
한국어
본 논문는 ‘알고리즘’이라는 키워드를 중심으로 NAVER 뉴스 데이터에 텍스트 마이닝 기법을 적용한 것이다. 연구의 목적은 뉴스 데이터에서 ‘알고리즘’과 관련된 주요 트렌드와 주제를 식별하고 분석하는 것이었다. 이를 위해 데이터 수집, 전처리, 특성 벡터화, 토픽 모델링 등의 과정을 수행하였다. 데이터 수집은 NAVER API를 사용하여 ‘알고리즘’ 키워드가 포함된 뉴스 기사를 대상으로 하였다. 수집된 데이터는 텍스트 전처리를 거쳐 분석에 적합한 형태로 변환되었다. 이후 특성 벡터화를 통해 텍스트 데이터를 머신러닝 알고리즘이 처리할 수 있는 수치적 형태로 변환하였 으며, LDA와 LSA와 같은 토픽 모델링 기법을 적용하여 주요 토픽들을 추출하고 분석하였다. 분석 결과, ‘알고리즘’ 키워드는 다양한 뉴스 주제에 걸쳐 상당한 중요성을 지니고 있음이 밝혀졌다. 특히, 기술 발전, 사회적 영향, 비즈니 스 전략 등과 관련된 토픽들이 주요하게 다루어졌다. 본 연구는 알고리즘과 관련된 뉴스 콘텐츠의 트렌드와 주제를 파악하는 데 있어 텍스트 마이닝 기법의 유용성을 입증하였다.
목차
요약 Abstract Ⅰ. 서론 Ⅱ. 사용 이론 1. 텍스트 마이닝 2. 특성 벡터화와 특성 추출 3. 토픽 모델링 Ⅲ. 분석 및 결과 1. 분석 2. 결과 Ⅳ. 결론 REFERENCES
황재민 [ Jae-Min Hwang | 서원대학교 정보통신공학과 학생(Master course, Department of Information & Communications, Seowon University) ]
홍서빈 [ Seo-Bin Hong | 서원대학교 정보통신공학과 학생(Master course, Department of Information & Communications, Seowon University) ]
강철수 [ Cheol-Soo Kang | 케이앤엑스정보통신 연구소장(Director, Company-affiliated Research Institute, KNX Information & Communication Co., Ltd.) ]
Corresponding Author
한국혁신산업학회 [The Korean Innovation Industry Society(KIIS)]
설립연도
2023
분야
공학>공학일반
소개
1. 혁신산업 융복합 기술 트렌드에 관한 다각적이고 깊이 있는 논의를 위한 국내 및 국제학술회의 개최를 개최함으로써 국내 융합기술의 발전 및 국제적 위상 강화
2. 산․학․연이 참여할 수 있는 국내 및 국제학술회의 개최를 통하여 혁신산업 융복합 기술의 발전 기반 조성
3. 학계, 관계, 산업계 전문가들의 창의적 융합기술에 대한 발표와 토론을 통하여 산‧학‧연 협력 체제를 더욱 확고히 함은 물론, 국내외 관련 단체와의 학술교류 및 협력으로 학문과 기술 발전에 공헌
간행물
간행물명
혁신산업기술논문지 [The Journal of Innovation Industry Technology]