Earticle

현재 위치 Home

대학수학능력시험 독서 영역의 교육 목표를 위한 자연어처리 기법을 통한 검증
Verification of educational goal of reading area in Korean SAT through natural language processing techniques

첫 페이지 보기
  • 발행기관
    한국융합학회 바로가기
  • 간행물
    한국융합학회논문지 KCI 등재 바로가기
  • 통권
    제13권 제1호 (2022.01)바로가기
  • 페이지
    pp.81-88
  • 저자
    이수민, 김경민, 임희석
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A407475

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
The major educational goal of reading part, which occupies important portion in Korean language in Korean SAT, is to evaluated whether a given text can be fully understood. Therefore given questions in the exam must be able to solely solvable by given text. In this paper we developed a datatset based on Korean SAT’s reading part in order to evaluate whether a deep learning language model can classify if the given question is true or false, which is a binary classification task in NLP. In result, by applying language model solely according to the passages in the dataset, we were able to acquire better performance than 59.2% in F1 score for human performance in most of language models, that KoELECTRA scored 62.49% in our experiment. Also we proved that structural limit of language models can be eased by adjusting data preprocess.
한국어
대학수학능력시험 국어 과목에서 중요한 비중을 차지하는 독서 영역의 주된 교육 목표는 주어진 지문을 온전히 이해할 수 있는가를 평가하는 데에 있다. 따라서 해당 지문에 포함된 질의를 주어진 지문만으로 풀이할 수 있는지는 해당 영역의 교육 목표와 관련이 깊다. 본 연구에서는 처음으로, 교육학 분야와 딥러닝을 접목하여 이러한 교육 목표가 실제로도 타당하게 실현 가능한지를 입증하고자 한다. 대학수학능력시험의 독서 영역의 개별 지문과 그에 수반된 다수의 문장 쌍(sentence pair)을 정제하여 추출하고, 해당 문장 쌍을 주어진 지문에 비추어 적절하거나(T), 적절하지 않은지(F)를 판단하는 이진 분류 태스크(binary classification task)에 적용하여 평가 하고자 한다. 그 결과, F1 스코어 기준 59.2%의 human performance를 뛰어넘는 성능을 62.49%의 KoELECTRA를 비롯한 대부분의 언어 모델에서 확인할 수 있었으며, 또한 데이터 전처리 과정에 변화를 줌으로써 언어 모델의 구조적 한계를 극복할 수 있었다.

목차

요약
Abstract
1. 서론
1.1 대학수학능력시험
1.2 언어 모델을 활용한 대학수학능력시험의 교육적목표 검증
2. 관련 연구
2.1 트랜스포머 기반 언어 모델의 도입
2.2 한국어 기반 사전 학습 언어 모델
2.3 교육 분야에서의 NLP 접목 사례
2.4 한국어 PLM 연구
2.5 데이터 증강 기법
3. 대학수학능력시험과 KSQA
3.1 대학수학능력시험의 데이터 추출
3.3 KSQA 데이터 전처리 과정
3.4 KSQA 언어 모델
4. 실험
4.1 KSQA 구성
4.2 평가 준거
4.3 실험 결과
5. 결론
REFERENCES

키워드

대학수학능력시험 딥러닝 이진 분류 태스크 언어 모델 데이터 전처리 Korean SAT Deep learning Binary classification task Language models

저자

  • 이수민 [ Soomin Lee | 고려대학교 컴퓨터학과 석사과정 ]
  • 김경민 [ Gyeongmin Kim | 고려대학교 컴퓨터학과 석박통합과정 ]
  • 임희석 [ Heuiseok Lim | 고려대학교 컴퓨터학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국융합학회 [Korea Convergence Society]
  • 설립연도
    2011
  • 분야
    복합학>학제간연구
  • 소개
    본회는 융합학문 및 융합기술을 교류를 통한 학문기술의 확대․발전․보급 및 기술개발 전략에 과학적으로 접근하여 융합학문 및 기술을 더욱 활성화하고, 회원 상호간의 정보 교류를 도모함으로써 지역과 나라발전에 기여함을 목적으로 한다.

간행물

  • 간행물명
    한국융합학회논문지 [Journal of the Korea Convergence Society]
  • 간기
    월간
  • pISSN
    2233-4890
  • 수록기간
    2010~2022
  • 십진분류
    KDC 530 DDC 620

이 권호 내 다른 논문 / 한국융합학회논문지 제13권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장