Earticle

현재 위치 Home

An Experimental Study on Building A Chinese Domain-Dependent Sentiment Lexicon

첫 페이지 보기
  • 발행기관
    한국언어과학회 바로가기
  • 간행물
    언어과학 KCI 등재 바로가기
  • 통권
    제27권 4호 (2020.11)바로가기
  • 페이지
    pp.239-272
  • 저자
    Jiabin Li, Jeesun Nam
  • 언어
    영어(ENG)
  • URL
    https://www.earticle.net/Article/A386031

※ 기관로그인 시 무료 이용이 가능합니다.

7,600원

원문정보

초록

영어
This study proposes an experimental approach to build a domain-dependent sentiment lexicon that is crucial for sentiment analysis of Chinese texts in the Deco Sentiment Analysis platform developed in Digital Language and Knowledge Contents Research Association (DICORA research center). More than 150,000 hotel review data were trained with word2vec models, and 80 emotional words were first selected as seed words. TF-IDF notion was used to measure the importance of the sentiment vocabulary in hotel reviews. In order to build the feature vector representation of each candidate word, the similarities between a term and the other 80 seed words were calculated and the upcoming step was expanding the lexicon with a double propagation method that requires recognizing feature words related to the sentiment expressions. Through the bootstrap of sentiment terms and features, the expansion of the sentiment lexicon could be performed. The evaluation of the expanded result is confirmed with rates set at 77.4% of precision and 92.6% of recall performance.

목차

Abstract
1. Introduction
2. Sentiment Lexicons
2.1. Existing Sentiment Lexicons
2.2. Domain-dependent Sentiment Lexicons
3. Properties of Chinese Hotel Review texts
3.1. Online Hotel Review Texts
3.2. Preprocessing6) Icons in Hotel Review Texts
3.3. Chinese Word Segmentation
4. Building an Initial Sentiment Lexicon
4.1. Word Vector Model and TF-IDF
4.2. Processing for Building an Initial Domain-dependent Sentiment Lexicon
4.3. Analysis of the Initial Sentiment Lexicon
5. Expanding the Initial Sentiment Lexicon
5.1. Sentiment Word Expansion and Feature Extraction
5.2. Applying Propagation Rules
6. Evaluation
6.1. Quantification of Evaluation Indicators
6.2. Performance Evaluation
7. Conclusion
참고문헌
Appendix

키워드

중국어 감성사전 Word2Vec 이중 증식 DecoSentA 플랫폼 사전 확장 주석 코퍼스 호텔 리뷰 Chinese Sentiment Lexicon Word2vec Double Propagation DecoSentA platform Lexicon Expansion Annotated Corpus Hotel Reviews

저자

  • Jiabin Li [ Hankuk University of Foreign Studies/Graduate Student ] First author
  • Jeesun Nam [ Hankuk University of Foreign Studies/Professor ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국언어과학회 [The Korean Association of Language Sciences]
  • 설립연도
    1993
  • 분야
    인문학>언어학
  • 소개
    한국언어과학회는 인간 사고에 대한 궁극적인 이해를 모태로 하여 그에 대한 구체적인 방법론을 제시하고, 인간 삶의 바람직한 사회적 행위를 이해하고 개선하는데 필요한 인간 중심의 언어학을 목표로하며, 언어의 이론적 연구와 그 응용을 목적으로 한다.

간행물

  • 간행물명
    언어과학 [Journal of Language Sciences]
  • 간기
    계간
  • pISSN
    1225-2522
  • 수록기간
    1994~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 705 DDC 405

이 권호 내 다른 논문 / 언어과학 제27권 4호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장