목적지향 대화시스템에서 LSTM 언어모델 기반의 한국어 자연어 생성

허윤석; 강상우; 서정연

216.73.217.141

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

목적지향 대화시스템에서 LSTM 언어모델 기반의 한국어 자연어 생성
Korean Natural Language Generation Using LSTM-based Language Model for Task-Oriented Spoken Dialogue System

발행기관

한국차세대컴퓨팅학회 바로가기
간행물

한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
통권

Vol.16 No.3 (2020.06)바로가기
페이지

pp.35-50
저자

허윤석, 강상우, 서정연
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A379294

원문정보

초록

영어: Natural language generation in the dialogue system is a task that transforms the semantic frame of the system utterance determined in the dialogue management phase into a natural language that can be understood by humans. Existing studies have still faced some obstacles in that only very limited types of utterances or grammatically incomplete ones are generated from the semantic frames. In order to address these issues simultaneously, we propose a Korean natural language generation model using a long short term memory based language model. In particular, we exploit the beam search decoding method to obtain system utterances with diverse structures and grammatical correctness. The experiments were conducted individually with respect to the word, morpheme, and syllable units, and the generated utterances were evaluated in both quantitative and qualitative ways. As a result, the morpheme-based model with the beam search decoding has achieved the most robust result of all. In fact, in the quantitative evaluation result of the generated sentence, the BLEU-4 score was 0.86 and the SER was 0.03, and the qualitative evaluation was also confirmed to be grammatically correct and contextually natural.

한국어: 대화시스템에서 자연어 생성은 대화관리 단계에서 결정한 시스템 발화의 의미표현을 사람이 이해할 수 있는 자연어 로 생성하는 것이다. 기존의 자연어 생성 연구는 의미표현에 대하여 매우 제한된 종류의 발화만을 생성하거나 문법 적으로 불완전한 발화를 생성한다는 문제점이 있다. 그래서 본 논문에서는 문제점들을 동시에 처리하기 위하여 Long Short Term Memory 기반의 언어모델을 이용한 한국어 자연어 생성 모델을 제안한다. 특히 우리는 시스템 발화의 다양성과 문법적 정확성을 높이기 위하여 빔서치 디코딩을 적용한다. 실험은 어절, 형태소, 음절단위에 따라 개별적으로 진행하였으며, 생성한 문장들은 정량적, 정성적 평가를 모두 진행하였다. 그 결과 형태소 단위로 학습한 제안모델에 빔서치 디코딩을 적용한 방법은 가장 좋은 성능을 보였다. 실제로 해당 생성 문장은 정량평가 결과에서 BLEU 지표는 0.86, Slot Error Rate 지표는 0.03을 기록하였으며 정성평가 역시 문법적으로 정확하고 문맥적 으로 충분히 자연스러운 결과임을 확인하였다.

요약
Abstract
1. 서론
2. 관련연구
2.1 규칙/템플릿 기반 자연어 생성 모델
2.2 말뭉치를 이용한 통계기반 자연어 생성 모델
3. 한국어 시스템 발화 생성을 위한 대용량말뭉치 소개
4. 한국어 자연어 생성을 위한 LSTM 언어모델
4.1 Recurrent Neural Network 기반의 언어모델
4.2 Long Short Term Memory를 이용한 언어모델
4.3 대화시스템에서 시스템 발화 생성을 위한 LSTM기반 언어모델
5. 실험환경 및 결과 분석
5.1 실험 환경
5.2 평가 척도
5.3 실험 결과 및 분석
6. 결론
참고문헌

키워드

딥러닝 언어모델 자연어 생성 대화시스템 Deep Learning Language Model Natural Language Generation Spoken Dialogue System

저자

허윤석 [ Yoonseok Heo | 서강대학교 컴퓨터공학과 ]
강상우 [ Sangwoo Kang | 가천대학교 소프트웨어학과 ] 교신저자
서정연 [ Jungyun Seo | 서강대학교 컴퓨터공학과 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
설립연도
2005
분야
공학>컴퓨터학
소개
본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

간행물명

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
간기
격월간
pISSN
1975-681X
수록기간
2005~2026
등재여부
KCI 등재
십진분류
KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.16 No.3

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

목적지향 대화시스템에서 LSTM 언어모델 기반의 한국어 자연어 생성
Korean Natural Language Generation Using LSTM-based Language Model for Task-Oriented Spoken Dialogue System

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.16 No.3

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

목적지향 대화시스템에서 LSTM 언어모델 기반의 한국어 자연어 생성 Korean Natural Language Generation Using LSTM-based Language Model for Task-Oriented Spoken Dialogue System

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.16 No.3

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

목적지향 대화시스템에서 LSTM 언어모델 기반의 한국어 자연어 생성
Korean Natural Language Generation Using LSTM-based Language Model for Task-Oriented Spoken Dialogue System