본 연구에서는 사용자 생성 컨텐츠 ( User-Generated Content: UGC ) 를 대상으로 Latent Dirichlet Allocation(LDA)기법을 이용하여 고객 리뷰에 대해 다중 토픽 수준의 감성분석 연구 모형을 제시한다. Tripadvisor.com에서 세계 주요 관광 도시의 호텔에 대해 고객의 온라인 리뷰를 대 상으로 총 104,039개를 수집하였다. LDA기법을 통해 전체 고 객 리뷰를 사용하여 호텔과 관련된 토픽 30개를 추출하였다. 추출된 토픽들을 대상으로 호텔에 관련된 6 가지 주요 토픽 (value, cleanliness, rooms, service, location, sleep quality) 을 선정하고, 제안된 연구 모형에서 고객 리뷰별로 6 가지 토 픽에 해당하는 문장에 대해 감성사전을 사용하여 감성을 분석 하였다. 고객 리뷰의 토픽별 감성값과 고객이 직접 호텔 속성 별로 평가한 세부점수와 비교하여 제안된 연구모형의 성능을 검증하였다. 제안모형의 정확도(accuracy)와 재현율(recall)의 값을 분석한 결과 제안모형의 성과가 우수한 것으로 분석되었 다. 본 연구의 결과를 이용하면 여행자의 온라인 리뷰를 대상 으로 고객의 세부 감성을 다양한 토픽별로 분석할 수 있어 고 객에게 여러 속성별로 리뷰작성을 요구하지 않고도 고객의 호 텔 속성별 감성을 분석할 수 있다.
목차
초록 1. 서론 2. 선행 연구 2.1 토픽 모델 2.2 LDA 기반 감성분석 3. 연구 프레임워크 4. 실험과 결관 분석 4.1 데이터 수집 4.2 실험 설계 4.3 결과 분석 5.결론 참고문헌