Earticle

현재 위치 Home

딥러닝 기반 한국어 맞춤법 교정을 위한 오류 유형 분류 및 분석
Classification and analysis of error types for deep learning-based Korean spelling correction

첫 페이지 보기
  • 발행기관
    한국융합학회 바로가기
  • 간행물
    한국융합학회논문지 KCI 등재 바로가기
  • 통권
    제12권 제12호 (2021.12)바로가기
  • 페이지
    pp.65-74
  • 저자
    구선민, 박찬준, 소아람, 임희석
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A404820

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Recently, studies on Korean spelling correction have been actively conducted based on machine translation and automatic noise generation. These methods generate noise and use as train and data set. This has limitation in that it is difficult to accurately measure performance because it is unlikely that noise other than the noise used for learning is included in the test set In addition, there is no practical error type standard, so the type of error used in each study is different, making qualitative analysis difficult. This paper proposes new 'error type classification' for deep learning-based Korean spelling correction research, and error analysis perform on existing commercialized Korean spelling correctors (System A, B, C). As a result of analysis, it was found the three correction systems did not perform well in correcting other error types presented in this paper other than spacing, and hardly recognized errors in word order or tense.
한국어
최근 기계 번역 기술과 자동 노이즈 생성 방법론을 기반으로 한국어 맞춤법 교정 연구가 활발히 이루어지고 있다. 해당 방법론들은 노이즈를 생성하여 학습 셋과 데이터 셋으로 사용한다. 이는 학습에 사용된 노이즈 외의 노이즈가 테스트 셋에 포함될 가능성이 낮아 정확한 성능 측정이 어렵다는 한계점이 존재한다. 또한 실제적인 오류 유형 분류 기준이 없어 연구마다 사용하는 오류 유형이 다르므로 질적 분석에 어려움을 겪고 있다. 이를 해결하기 위해 본 논문은 딥러닝 기반 한국어 맞춤법 교정 연구를 위한 새로운 ’오류 유형 분류 체계‘를 제안하며 이를 바탕으로 기존 상용화 한국어 맞춤법 교정기(시스템 A, 시스템 B, 시스템 C)에 대한 오류 분석을 수행하였다. 분석결과, 세 가지 교정 시스템들이 띄어쓰기 오류 외에 본 논문에서 제시한 다른 오류 유형은 교정을 잘 수행하지 못했으며 어순 오류나 시제 오류의 경우 오류 인식을 거의 하지 못함을 알 수 있었다.

목차

요약
Abstract
1. 서론
2. 관련 연구 및 배경지식
2.1 한국어 맞춤법 교정
2.2 자동 노이즈 생성 기법
3. 제안하는 오류 유형 분류 체계
4. 오류 분석
4.1 데이터
4.2 한국어 맞춤법 교정기
4.3 분석 결과
5. 결론
REFERENCES

키워드

한국어 맞춤법 교정 기계 번역 인공신경망 기계번역 오류 분석 자연어처리 Korean spelling correction Machine translation Artificial neural network machine translation Error analysis Natural language processing

저자

  • 구선민 [ Seonmin Koo | 건국대학교 컴퓨터공학과 학생 ]
  • 박찬준 [ Chanjun Park | 고려대학교 컴퓨터학과 석박사통합과정 ]
  • 소아람 [ Aram So | 고려대학교 Human-inspired AI연구소 연구교수 ]
  • 임희석 [ Heuiseok Lim | 고려대학교 컴퓨터학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국융합학회 [Korea Convergence Society]
  • 설립연도
    2011
  • 분야
    복합학>학제간연구
  • 소개
    본회는 융합학문 및 융합기술을 교류를 통한 학문기술의 확대․발전․보급 및 기술개발 전략에 과학적으로 접근하여 융합학문 및 기술을 더욱 활성화하고, 회원 상호간의 정보 교류를 도모함으로써 지역과 나라발전에 기여함을 목적으로 한다.

간행물

  • 간행물명
    한국융합학회논문지 [Journal of the Korea Convergence Society]
  • 간기
    월간
  • pISSN
    2233-4890
  • 수록기간
    2010~2022
  • 십진분류
    KDC 530 DDC 620

이 권호 내 다른 논문 / 한국융합학회논문지 제12권 제12호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장