Earticle

현재 위치 Home

기계학습을 이용한 한국어 대화시스템 도메인 분류
Machine Learning Based Domain Classification for Korean Dialog System

첫 페이지 보기
  • 발행기관
    중소기업융합학회 바로가기
  • 간행물
    융합정보논문지(구 중소기업융합학회논문지) KCI 등재 바로가기
  • 통권
    제9권 제8호 (2019.08)바로가기
  • 페이지
    pp.1-8
  • 저자
    정영섭
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A360048

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Dialog system is becoming a new dominant interaction way between human and computer. It allows people to be provided with various services through natural language. The dialog system has a common structure of a pipeline consisting of several modules (e.g., speech recognition, natural language understanding, and dialog management). In this paper, we tackle a task of domain classification for the natural language understanding module by employing machine learning models such as convolutional neural network and random forest. For our dataset of seven service domains, we showed that the random forest model achieved the best performance (F1 score 0.97). As a future work, we will keep finding a better approach for domain classification by investigating other machine learning models.
한국어
대화시스템은 인간과 컴퓨터의 상호작용에 새로운 패러다임이 되고 있다. 자연어로써 상호작용함으로써 인간 은 보다 자연스럽고 편리하게 각종 서비스를 누릴 수 있게 되었다. 대화시스템의 구조는 일반적으로 음성 인식, 자연 어 이해, 문맥 파악 등의 여러 모듈의 파이프라인으로 이뤄지는데, 본 연구에서는 자연어 이해 모듈의 도메인 분류 문 제를 풀기 위해 convolutional neural network, random forest 등의 기계학습 모델을 비교하였다. 사람이 직접 태 깅한 총 7개 서비스 도메인 데이터에 대하여 각 문장의 도메인을 분류하는 실험을 수행하였고 random forest 모델 이 F1 score 0.97 이상으로 가장 높은 성능을 달성한 것을 보였다. 향후 다른 기계학습 모델들을 추가 실험함으로써 도메인 분류 성능 개선을 지속할 계획이다.

목차

요약
Abstract
1. Introduction
2. Background
2.1 Dialog System
2.2 Domain Classification
2.3 Machine Learning
3. Machine Learning Based Domain Classification
3.1 Data Investigation
3.2 Convolutional Neural Network
3.3 Random Forest
4. Experiment
4.1 Data and Parameter Setting
4.2 Result
5. Conclusion
REFERENCES

키워드

한국어 대화시스템 자연어이해 도메인 분류 기계학습 랜덤 포레스트 Korean dialog system Natural language understanding Domain classification Machine learning Random forest

저자

  • 정영섭 [ Young-Seob Jeong | 순천향대학교 빅데이터공학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    중소기업융합학회 [Convergence Society for SMB]
  • 설립연도
    2011
  • 분야
    공학>공학일반
  • 소개
    본 회는 정보기술을 다양한 산업 분야에 융합하는 정책 및 관련 기술들을 개발하고 보급함으로써 중소기업 발전은 물론 이를 통한 국가발전과 국제협력 증진에 기여하고자 한다.

간행물

  • 간행물명
    융합정보논문지(구 중소기업융합학회논문지) [Journal of Convergence for Information Technology]
  • 간기
    월간
  • pISSN
    2586-1816
  • eISSN
    2586-4440
  • 수록기간
    2011~2022
  • 십진분류
    KDC 004 DDC 004

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제9권 제8호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장