The purpose of this study was to explore the differences in sentiment on social networking sites among six languages (English, German, Russian, Spanish, Turkish and Dutch). A total of 204 million tweets were collected using Streaming API. Subjective/objective ratio, sentiment strength, positive/negative ratio, number of retweets and boundary impermeability were analyzed with SentiStrength to estimate the trends of emotional expression via Twitter. The results showed that subjective/objective ratio and the positive/negative ratio of tweets were significantly different by languages (p<0.001). And, there were significant effects of language on sentiment strength, boundary impermeability and the number of retweets (p<0.001). The results also indicate that the cross-cultural, language differences should be taken into account in sentiment analysis on SNS.
한국어
본 연구의 목적은 SNS 활용에 있어 사용자 언어 간 감성의 평균차이가 있는지를 검증하는 것이다. 가장 많이 이용되는 SNS 중 하나인 트위터를 대상으로, 영어, 독일어, 러시아어, 스페인어, 터키어 및 네덜란드어 등 6개 언어로 작성된 약 2억 개 트윗을 스트리밍 API를 이용하여 수집하였으며, SentiStrength를 이용하여 주관적/객관적 비율, 감성강도, 긍정/부정 비율, 리트윗 횟수 및 경계불투과도 등에 대한 분석을 시행하고, 트위터를 통한 감성표현의 경향성과 변동을 파악하였다. 분석결과, 언어권에 따라 주관적/객관적 트윗 비율과 긍정/부정 트윗 비율이 각각 통계적으로 유의한 차이가 있는 것으로 나타났다(p<0.001). 또한, 언어의 종류는 감성강도와 경계 불투과도 그리고 리트윗 횟수에 통계적으로 유의한(p<0.001) 영향을 미치는 것으로 파악되었다. 이러한 결과는 SNS를 활용한 감성분석에 있어 언어, 문화 별 경향성 및 수준차이를 반드시 고려하여야 한다는 것을 보여준다.
목차
요약 Abstract 1. 서론 2. 연구 대상 및 방법 3. 분석 결과 3.1 언어권 별 주관적(subjective) 트윗 비율 3.2 언어권 별 감성강도(sentiment strength) 3.3 주관적 트윗의 긍정 비율 3.4 감성 극성과 경계 불투과도 3.5 감성 강도와 리트윗 4. 결론 ACKNOWLEDGMENTS REFERENCES
한국디지털정책학회 [The Society of Digital Policy & Management]
설립연도
2003
분야
복합학>과학기술학
소개
디지털기술 및 산업정책, 디지털경제, 관련 산업의 연구, 전자정부, 디지털정치에 관한 제도적, 정책적 연구, 디지털경영, 전자상거래, e-비즈니스에 관한 실용적 연구, 학술연구지 발간 및 학술대회 개최 등을 통하여 디지털경제 및 디지털경영에 관련되는 국가정책 분야의 연구 및 교류를 촉진하고 국가 및 기업 정보화와 디지털산업의 발전에 공헌한다.