정치인 어휘의 개인 차이와 시기별 추이 조사 방법 : 기사 내 인용문 스크래핑을 통한 워드 클라우드와 어휘 상관성 분석
Analyzing How the Vocabularies of Politicians Differ and Change : Comparative Word Clouds and Frequency Correlation Analyses with the Direct Quotations Scraped from a Korean News Database
If the goal of politics is to persuade people and gain power, language should be a crucial means to achieve the goal. The present study is an exploration of the on-line source of the news articles(i.e., bigkinds.or.kr) containing politicians’ quotations, the process of refining the raw materials, the ways of visualizing and indexing the refined data, and the process of interpreting the results and drawing conclusions based on them. The news articles extracted from the database were those containing the direct quotations of the four key politicians during the nationwide confrontation following the President Moon’s designation of Professor Cho as the Minister of Justice of Korea. The visualization of the refined data was done through so-called ‘word cloud’ method and the quantitative indexing process, performed to verify the interpretations of the word clouds, was done by a statistical correlation analysis with the four politicians’ number of using shared vocabularies during their speeches and interviews. The Python commands, compiled and packaged by the present researchers, can be readily used for future studies and have flexibility sufficient to deal with any changes in the data source. Moreover, the package can be applied to study other figures than politicians and be tailored for specific purposes of the studies by controlling the contents of the ‘stopword’ and the ‘user-appended’ dictionaries.
한국어
대중을 설득하여 권력을 얻는 것이 정치의 목표라면, 말(言)은 그 목표를 달성하기위한 가장 강력한 수단이다. 본 연구는 정치인의 말을 연구하는 데 필요한 원천자료의 출처, 그 자료를 연구에 사용할 수 있는 형태로 정제하는 데 필요한 후속 절차, 정제된 자료에서 도출된 결과를 시각화하고 지표화하는 방법, 그리고 그것을 해석하여 함의를 끌어내는 과정을 최근 가장 관심이 집중되었던 조국 교수의 장관지명/임명의 맥락에서 소개하고자 실시된 방법론적 제언이다. 한국언론재단의 ‘빅카인즈(bigkinds.or.kr)’의 인용문 검색 결과가 원천자료로 사용되었으며, 중복제거 작업과 자연어 처리, 그리고 불용어와 사용자추가 사전들의 투입을 거쳐 정제된 자료는 워드클라우드 방식으로 시각화되었다. 계량적 지표화는 4명의 정치인들이 공통적으로 사용한 단어들의 출현빈도를 따로 집계하여 상관분석을 실시하는 방법으로 진행되었으며, 워드 클라우드 해석의 타당성을 객관적 수치로 확인해주는 증거들을 추가할 수있었다. 본 연구자들이 제작한 파이썬 명령어들은 하나의 패키지로 구성되어 향후에있을 후속연구에 활용될 수 있으며, 원천자료에 구조적 변화가 있을 경우 그에 맞춰자유롭게 변경될 수 있는 유연성을 갖고 있다. 또한 이 패키지의 활용은 정치인들에만 국한되지 않을 것이며, 불용어 사전과 사용자추가 사전들의 교체를 통해 특정 연구목적에 부합되는 맞춤형 결과를 도출하는 것 역시 가능할 것이다.
목차
요약 1. 연구의 배경과 목적 2. 문헌연구 1) 빅카인즈: 개요와 활용사례 2) 정보원의 어휘에 관한 연구들 3) 기사 내 인용문에 관한 연구들 4) 워드 클라우드 3. 연구문제 4. 연구방법 1) 기사 스크래핑(scraping) 2) 원천자료의 정제 5. 연구결과 1) 워드 클라우드 결과 2) 상관성 분석 결과 6. 결론 및 제언 참고문헌
키워드
정치인어휘. 인용시각화워드 클라우드지표화상관관계파이썬자연어 처리PoliticianVocabularyQuotationVisualizationWord CloudIndexingCorrelationPythonNatural Language Processing
한국정치커뮤니케이션학회 [Korean Political communication Association]
설립연도
2004
분야
사회과학>정치외교학
소개
올바른 민주주의 창달과 확산을 위해 정치커뮤니케이션 현상에 대한 체계적이고 사변적인 접근과 연구가 절실히 요구되고 있는 상황이다. 이에 한국정치커뮤니케이션학회를 창립하여 올바른 민주공동체의 길을 찾고자 노력한다. 본 학회는 이념적 편향성을 지양하고 학문적 이론과 더불어 정치적 실제에 대한 연구도 지향할 것이다.