Earticle

현재 위치 Home

텍스트 마이닝을 통한 셰익스피어 학술논문 영어초록 코퍼스의 토픽모델링 분석
Topic Modeling Analysis in a Shakespeare Research Article English Abstract Corpus through Text Mining

첫 페이지 보기
  • 발행기관
    한국언어과학회 바로가기
  • 간행물
    언어과학 KCI 등재 바로가기
  • 통권
    제24권 4호 (2017.11)바로가기
  • 페이지
    pp.55-82
  • 저자
    장세은, 이수상, 송원문, 정해룡, 이성민, 김재훈
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A315081

※ 기관로그인 시 무료 이용이 가능합니다.

6,700원

원문정보

초록

영어
This study explores a Shakespeare Research Article Abstract Corpus through topic modeling, a machine-learning technique that automatically identifies topics in a corpus. First, we identify which topics are prominent through the entire corpus. We also investigate the top 20 topics in each particular decade such as the 1980s, 1990s, 2000s, and 2010s and examine patterns, trends and ranking changes such as falling, rising, and curve contours over time. In addition, we extract corpus keywords using the cross-validation method on Wordsmith tools 6.0. in order to compare similarities and differences between topic modeling keywords and corpus keywords. We also select each group of absolute keywords which have zero frequency in reference corpora to examine which words are associated with new trends in each period and to explore which shared common words are found in topic modeling and corpus keywords. Finally each group of non-absolute keywords extracted from the three corpora is discussed to check patterns and trends identical to topic modeling. The results of this comparison conform that it is hard to assert that topic modeling keywords are well grouped into certain research subjects over corpus keywords and show better trends over time than corpus keywords. This is because both topic modeling keywords and corpus keywords show their own respective merits.

목차

Abstract
 1. 서론
 2. 선행 연구
 3. 연구자료 및 연구방법
  3.1. 자료통계
  3.2. 연구방법
 4. 연구결과
  4.1. 토픽모델링 결과 분석
  4.2. 토픽변화 양상과 추이유형
  4.3. 토픽모델링 키워드와 코퍼스 키워드 간의 비교
 5. 결론
 참고문헌

키워드

셰익스피어 코퍼스언어학 토픽모델링 머신러닝 키워드분석 트렌드 분석 Shakespeare Corpus Linguistics topic modeling machine learning keyword analysis trend analysis

저자

  • 장세은 [ Se-Eun Jhang | 한국해양대학교 ] 제1저자
  • 이수상 [ Soo-Sang Lee | 부산대학교 ]
  • 송원문 [ Won-Moon Song | 신라대학교 ]
  • 정해룡 [ Hae Ryong Jung | 부경대학교 ]
  • 이성민 [ Sung-Min Lee | 한국해양대학교 ]
  • 김재훈 [ Jae-Hoon Kim | 한국해양대학교 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국언어과학회 [The Korean Association of Language Sciences]
  • 설립연도
    1993
  • 분야
    인문학>언어학
  • 소개
    한국언어과학회는 인간 사고에 대한 궁극적인 이해를 모태로 하여 그에 대한 구체적인 방법론을 제시하고, 인간 삶의 바람직한 사회적 행위를 이해하고 개선하는데 필요한 인간 중심의 언어학을 목표로하며, 언어의 이론적 연구와 그 응용을 목적으로 한다.

간행물

  • 간행물명
    언어과학 [Journal of Language Sciences]
  • 간기
    계간
  • pISSN
    1225-2522
  • 수록기간
    1994~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 705 DDC 405

이 권호 내 다른 논문 / 언어과학 제24권 4호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장