Earticle

현재 위치 Home

자연어처리 모델을 이용한 이커머스 데이터 기반 감성 분석 모델 구축
E-commerce data based Sentiment Analysis Model Implementation using Natural Language Processing Model

첫 페이지 보기
  • 발행기관
    한국융합학회 바로가기
  • 간행물
    한국융합학회논문지 KCI 등재 바로가기
  • 통권
    제11권 제11호 (2020.11)바로가기
  • 페이지
    pp.33-39
  • 저자
    최준영, 임희석
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A385620

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
In the field of Natural Language Processing, Various research such as Translation, POS Tagging, Q&A, and Sentiment Analysis are globally being carried out. Sentiment Analysis shows high classification performance for English single-domain datasets by pretrained sentence embedding models. In this thesis, the classification performance is compared by Korean E-commerce online dataset with various domain attributes and 6 Neural-Net models are built as BOW (Bag Of Word), LSTM[1], Attention, CNN[2], ELMo[3], and BERT(KoBERT)[4]. It has been confirmed that the performance of pretrained sentence embedding models are higher than word embedding models. In addition, practical Neural-Net model composition is proposed after comparing classification performance on dataset with 17 categories. Furthermore, the way of compressing sentence embedding model is mentioned as future work, considering inference time against model capacity on real-time service.
한국어
자연어 처리 분야에서 번역, 형태소 태깅, 질의응답, 감성 분석등 다양한 영역의 연구가 활발히 진행되고 있다. 감성 분석 분야는 Pretrained Model을 전이 학습하여 단일 도메인 영어 데이터셋에 대해 높은 분류 정확도를 보여주 고 있다. 본 연구에서는 다양한 도메인 속성을 가지고 있는 이커머스 한글 상품평 데이터를 이용하고 단어 빈도 기반의 BOW(Bag Of Word), LSTM[1], Attention, CNN[2], ELMo[3], KoBERT[4] 모델을 구현하여 분류 성능을 비교하였 다. 같은 단어를 동일하게 임베딩하는 모델에 비해 문맥에 따라 다르게 임베딩하는 전이학습 모델이 높은 정확도를 낸다 는 것을 확인하였고, 17개 카테고리 별, 모델 성능 결과를 분석하여 실제 이커머스 산업에서 적용할 수 있는 감성 분석 모델 구성을 제안한다. 그리고 모델별 용량에 따른 추론 속도를 비교하여 실시간 서비스가 가능할 수 있는 모델 연구 방향을 제시한다.

목차

요약
Abstract
1. 서론
2. 관련 연구
3. 감성 분석 모델
3.1 BOW(Bag of Word) 모델
3.2 BDLSTM(BiDirectional Long Short Term Memory) 모델
3.3 BDLSTM(BiDirectional Long Short Term Memory) + Attention 모델
3.4 CNN(Convolutional Neural Net) 모델
3.5 ELMo(Embeddings from Language Models)모델
3.6 KoBERT(Korean Bidirectional Embedding Representation Transformer) 모델
4. 모델 구현
4.1 Dataset 설명
4.2 형태소 분석기
4.2 모델 실험 시스템 환경
4.3 구현 감성 분석 모델 구성
5. 모델 성능 결과
6. 결론 및 향후 계획
REFERENCES

키워드

자연어처리 감성 분석 이커머스 워드 임베딩 센텐스 임베딩 전이학습 NLP BERT KoBERT ELMo LSTM CNN

저자

  • 최준영 [ Jun-Young Choi | 고려대학교 컴퓨터정보통신대학원 석사과정 ]
  • 임희석 [ Heui-Seok Lim | 고려대학교 컴퓨터학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국융합학회 [Korea Convergence Society]
  • 설립연도
    2011
  • 분야
    복합학>학제간연구
  • 소개
    본회는 융합학문 및 융합기술을 교류를 통한 학문기술의 확대․발전․보급 및 기술개발 전략에 과학적으로 접근하여 융합학문 및 기술을 더욱 활성화하고, 회원 상호간의 정보 교류를 도모함으로써 지역과 나라발전에 기여함을 목적으로 한다.

간행물

  • 간행물명
    한국융합학회논문지 [Journal of the Korea Convergence Society]
  • 간기
    월간
  • pISSN
    2233-4890
  • 수록기간
    2010~2022
  • 십진분류
    KDC 530 DDC 620

이 권호 내 다른 논문 / 한국융합학회논문지 제11권 제11호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장