Earticle

현재 위치 Home

TOEFL11을 이용한 비지도 토픽 모델링
Unsupervised Topic Modeling using TOEFL11.

첫 페이지 보기
  • 발행기관
    한국언어과학회 바로가기
  • 간행물
    언어과학 KCI 등재 바로가기
  • 통권
    제26권 1호 (2019.02)바로가기
  • 페이지
    pp.51-70
  • 저자
    윤태진
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A349816

※ 기관로그인 시 무료 이용이 가능합니다.

5,500원

원문정보

초록

영어
This paper aims at modeling topics from TOEFL essay samples in the TOEFL11 corpus. The TOEFL11 corpus is a collection of 12,100 TOEFL writing samples submitted by test-takers from 11 different countries. The paper applied an unsupervised method (i.e. Latent Dirichlet Allocation or LDA) of clustering texts to written samples, with the aim of automatic modeling of topics. For each of the 11 non-native TOEFL test takers, 1,100 TOEFL essays were transformed to a document-term matrix, and then were fed into the LDA function in the R software. The number of potential topics was set to be 8, which was the same number of prompts the test takers had been given when they took the test. The overall accuracy ranged from 83% to 99% depending on the native language of the test takers. Further analysis needs to be conducted to see how reliably the unsupervised LDA method can be used in automatically classifying written samples to potential topics. Nevertheless, the paper provides an empirical foundation that automatic topic modeling can be applied in an unsupervised way even to the writing sample of English learners. (Sungshin Women’s University)

목차

Abstract
1. 서론
2. 연구 방법
2.1. TOEFL11 말뭉치
2.2. 데이터의 선처리(pre-processing)
2.3. 토픽 모델링
3. 결과
4. 결론
참고문헌

키워드

토플 에세이 TOEFL11 코퍼스 학습자 말뭉치 LDA (잠재 디리크레 할당) 토픽 모델링 비지도 학습 TOEFL essays TOEFL11 corpus learner corpus LDA(Latent Dirichlet Allocation) topic modeling unsupervised learning

저자

  • 윤태진 [ Tae-Jin Yoon | 성신여자대학교 부교수 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국언어과학회 [The Korean Association of Language Sciences]
  • 설립연도
    1993
  • 분야
    인문학>언어학
  • 소개
    한국언어과학회는 인간 사고에 대한 궁극적인 이해를 모태로 하여 그에 대한 구체적인 방법론을 제시하고, 인간 삶의 바람직한 사회적 행위를 이해하고 개선하는데 필요한 인간 중심의 언어학을 목표로하며, 언어의 이론적 연구와 그 응용을 목적으로 한다.

간행물

  • 간행물명
    언어과학 [Journal of Language Sciences]
  • 간기
    계간
  • pISSN
    1225-2522
  • 수록기간
    1994~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 705 DDC 405

이 권호 내 다른 논문 / 언어과학 제26권 1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장