[Purpose] The purpose of this study is to structure tourism issues in Haeundae district, Busan city by subject using news text data, and to confirm their semantic relationship. By using unstructured text data, we tried to quantitatively grasp the social interest and issue structure of tourism issues beyond the traditional numerical-based approach. [Methodology] The target area of analysis was Haeundae district in Busan city, South Korea. News articles published between January 1, 2010, and December 31, 2024, were collected from the BigKinds platform provided by the Korea Press Foundation. Among a total of 157,377 articles, 13,295 containing tourism-related keywords were selected for analysis. The preprocessing stage involved removing stopwords, filtering duplicate articles, and performing morphological analysis. Subsequently, Latent Dirichlet Allocation (LDA) topic modeling was applied in a Python environment to extract the distribution of major tourism-related topics and keywords, and the optimal number of topics was determined. [Findings] As a result of the analysis, a total of 11 key themes were derived, which shows what structural characteristics and social interests have been formed in Haeundae-gu, Busan. Each topic reflects major issues that have repeatedly emerged in the Haeundae area, suggesting that tourism is closely linked to urban policy, local industry, and cultural activities beyond simple visit activities. In particular, various areas such as regional development, industrial policy, cultural contents, and smart cities appear at the same time, revealing the multi-layered and complex characteristics of Haeundae tourism. [Implications] This study provides methodological contributions by complementing traditional quantitative tourism research through the use of unstructured news text data to present the structural characteristics of tourism issues in a measurable form. The findings can serve as a foundational resource for data-driven decision-making in various fields, including tourism policy development, urban planning, regional marketing strategies, and the establishment of smart tourism cities.
한국어
[연구목적] 본 연구의 목적은 뉴스 텍스트 데이터를 활용하여 부산 해운대 지역의 관광 이슈를 주제별로 구조화하고, 그 의미적 관계를 확인하는 것이다. 비정형 텍스트 데이터를 활용함으로써 전통적인 수치 기반의 접근 방식을 넘어 관광 이슈의 사회적 관심과 이슈 구조를 정량적으로 파악하고자 하였다. [연구방법] 연구 대상 지역은 국내 유명 관광지로 알려진 부산광역시 해운대구로 설정하였으며, 한국언론진 흥재단의 BigKinds 플랫폼에서 2010년 1월 1일부터 2024년 12월 31일까지의 뉴스 기사 데이터를 수집하였다. 총 157,377건 중 ‘관광’ 관련 키워드를 포함한 13,295건을 선별하여 분석하였으며, 전처리 과정에서 불용어 제거, 중복 기사 필터링, 형태소 분석을 수행하였다. 이후 Python 환경에서 LDA 토픽모델링을 적용하여 최적의 토픽 수를 산정하고, 관광 관련 주요 주제와 키워드의 분포를 추출하였다. [연구결과] 분석 결과 총 11개의 핵심 주제가 도출되었으며, 이는 부산 해운대구 관광이 어떤 구조적 특성과 사회적 관심 속에서 형성되어 왔는지를 보여준다. 각 토픽은 해운대 지역에서 반복적으로 등장한 주요 이슈를 반영하고 있으며, 관광이 단순한 방문 활동을 넘어 도시정책, 지역 산업, 문화 활동과 긴밀하게 연계되어 있음 을 시사한다. 특히 지역개발, 산업정책, 문화콘텐츠, 스마트도시 등 다양한 영역이 동시에 나타나며, 해운대 관 광의 다층적이고 복합적인 성격을 드러낸다. [연구의 시사점] 본 연구는 기존의 정형 데이터 중심 관광 연구를 보완하여, 뉴스 텍스트라는 비정형 데이 터를 통해 관광 이슈의 구조를 정량적으로 제시하였다는 점에서 방법론적 기여를 가진다. 또한 분석 결과는 수립, 도시계획, 지역 마케팅 전략, 스마트 관광도시 조성 등 다양한 분야에서 데이터 기반의 의사결정을 지원 하는 기초 자료로 활용될 수 있다.
목차
< 국문요약 > Ⅰ. 서론 Ⅱ. 이론적 배경 및 연구가설 1.1 텍스트마이닝 기반 관광 이슈 분석 2.2 LDA 토픽모델링 Ⅲ. 연구방법 Ⅳ. 분석 결과 4.1 키워드 빈도 및 워드클라우드 4.2 LDA 토픽모델링 결과 Ⅴ. 결론 참고문헌 < Abstract >
키워드
관광 이슈뉴스 기사비정형 텍스트 데이터LDA토픽모델링Tourism IssuesNewsUnstructured Text DataLatent Dirichlet Allocation(LDA)Topic Modeling
대한경영정보학회 [Daehan Academy of Management Information Systems]
설립연도
1997
분야
사회과학>경영학
소개
경영학 및 경영정보관련학을 전공한 교수 및 연구원들의 순수연구단체로서 연구를 통해 논문집 발간 및 학술대회를 개최하고, 산학관 협력을 통한 사회봉사와 연구활동을 목적으로 이루어진 학술단체입니다. 이를 위해 다음과 같은 활동을 하게 됩니다. 첫째, 경영학 및 경영정보학, 전산학의 이론과 실무에 관련된 연구, 둘째, 연구발표회, 강연회, 세미나 등의 개최, 셋째, 본 학회의 목적을 같이 하는 국내외 제 학회와의 교류, 넷째, 본 학회의 목적달성에 필요한 제반 협조 사업 등을 합니다.