We often use spellcheckers in order to correct the syntactic errors in our documents. However, these computer programs are not enough for elementary school students, because their sentences are not smooth even after correcting the syntactic errors in many cases. In this paper, we introduce an automated method for evaluating the smoothness of two synonymous sentences. This method uses a recurrent neural network to solve the problem of long-term dependencies and exploits subwords to cope with the rare word problem. We trained the recurrent neural network language model based on a monolingual corpus of about two million English sentences. In our experiments, the trained model successfully selected the more smooth sentences for all of nine types of test set. We expect that our approach will help in elementary school writing after being implemented as an application for smart devices.
한국어
작성된 문서의 문법적 오류 교정을 할 때 맞춤법 검사기를 사용하는 것이 일반적이다. 그러나 초등학생들이 작성한 글 중에는 문법적으로는 옳더라도 자연스럽지 않은 문장이 있을 수 있다. 본 논문에서는 동일한 의미를 가진 2개의 문장이 주어졌을 때, 어떤 것이 더 자연스러운 문장인지 자동 판별할 수 있는 방법을 소개한다. 이 방법은 순환 신경망(recurrent neural network)을 이용하여 장기 의존성(long-term dependencies) 문제를 해결하 고, 보조 단어(subword)를 사용하여 희소 단어(rare word) 문제를 해결한다. 약 200만 문장의 단일어 코퍼스를 통해 순환 신경망 기반 언어 모델을 학습하였다. 그 결과, 초등학생들이 주로 틀리는 표현들과 그에 대응하는 올 바른 표현을 입력으로 주었을 때, 모든 경우에 대해 자연스러운 표현을 자동으로 선별할 수 있었다. 본 소프트웨 어가 스마트 기기에 사용될 수 있는 형태로 구현된다면 실제 초등학교 현장에서 활용 가능할 것으로 기대된다.
목차
요약 ABSTRACT 1. 서론 2. 관련 연구 2.1 ICT 기반 교육 2.2 통계 기반 언어 모델 3. 신경망 기반 언어 모델 3.1 순환 신경망을 활용한 언어 모델 3.2 보조 단어를 이용한 데이터 전처리 4. 실험 4.1 실험 환경 4.2 실험 결과 5. 결론 참고문헌
키워드
초등 글쓰기 자동 평가순환 신경망언어 모델Elementary School WritingRecurrent Neural NetworkLanguage Model
한국정보교육학회 [Korean Association of Information Education]
설립연도
1997
분야
사회과학>교육학
소개
사단법인 한국정보교육학회는 21세기 지식 정보화 사회에서 정보 교육에 관한 학술 및 기술 발전에 기여하기 위하여 정보교육과 관련된 학술대회개최, 학술논문지 발간, 연구지원사업 등을 추진하여 21세기 지식 정보화 시대의 초석을 마련하며 정부에서 추진하고 있는 교육정보화 사업과 연계하는 것을 기본 방향으로 한다.
간행물
간행물명
정보교육학회논문지 [Journal of The Korean Association of Information Education]