Earticle

현재 위치 Home

일반 논문

텍스트마이닝을 활용한 京派와 海派 작품분석 : RAG 기반 챗봇 분석 가능성과 한계점
A Text Mining Analysis of 京派 and 海派 Literary Works : Possibilities and Limitations of RAG-based Chatbot Analysis

첫 페이지 보기
  • 발행기관
    경기대학교 인문학연구소 바로가기
  • 간행물
    시민인문학 KCI 등재 바로가기
  • 통권
    제49호 (2025.08)바로가기
  • 페이지
    pp.203-231
  • 저자
    하두진, 박민준
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A471557

※ 기관로그인 시 무료 이용이 가능합니다.

6,900원

원문정보

초록

영어
This study empirically examines the potential and limitations of literary analysis using a Retrieval-Augmented Generation (RAG)-based chatbot—a method extending from text mining—focusing on two representative schools of modern Chinese literature: Jingpai(京派) and Haipai(海派). Specifically, the research explores how non-literature majors can utilize an automated question- answering system to investigate character relationships, emotional tone, and stylistic features within literary texts, thereby proposing a methodological alternative to conventional qualitative approaches in literary scholarship. To this end, a searchable corpus was constructed by embedding 35 selected works from Jingpai and Haipai authors into vector representations. A RAG-based chatbot system was then designed to generate answers based on this corpus. Comparative experiments were conducted with general-purpose large language models (LLMs) such as GPT and Claude, alongside a domain- specialized small language model (SLM) fine-tuned on Chinese literature. The findings reveal that the SLM demonstrated superior factual grounding and significantly reduced hallucinations, thus enhancing the accuracy and reliability of literary interpretation. The results indicate that SLMs, when coupled with RAG architecture, can generate responses grounded in actual texts, thereby expanding the possibilities for data-driven literary analysis. Moreover, the RAG-based chatbot functioned as an "interpretive assistant," enabling even non-specialists to derive humanistic insights. This suggests a promising new direction for interdisciplinary research, bridging computational linguistics and the humanities.
한국어
본 연구는 텍스트마이닝 기법의 연장선인 RAG 기반 챗봇을 활용하여 중국 현대 문학의 대표적 문학 유파인 京派와 海派를 대상으로, RAG(Retrieval-Augmented Generation) 기반 챗봇을 활용한 문학 분석의 가능성과 한계를 실증적으로 고찰한 다. 특히, 비문학 전공자가 자동화된 질의응답 시스템을 통해 문학작품의 인물관계, 감성, 문체를 탐색하는 과정을 통해, 기존의 정성적 해석 중심의 문학 연구에 새로운 방법론적 대안을 제시하고자 한다. 연구에서는 총 35편의 京派·海派 작품을 벡터 임베딩하여 검색 가능한 코퍼스를 구축하고, 이를 기반으로 질문에 응답하는 챗봇 시스템을 설계하였다. 다음으로 GPT 및 Claude와 같은 범용 LLM과의 비교 실험을 통해, 중국문학 영역에 특화된 소형 언어모델(SLM)의 사실 기반 응답 능력과 환각 (Hallucination) 감소 효과를 확인하였다. 그 결과, SLM은 실제 문헌에 근거한 응답을 생성함으로써 문학 분석의 정확 성과 신뢰도를 높였으며, 데이터 기반 해석의 가능성을 보여주었다. 아울러, RAG 기반 챗봇은 비전공자도 인문학적 통찰을 발휘할 수 있도록 지원하는 ‘해석 보조자’로서의 잠재력을 지닌다는 점에서 학제 간 융합 연구의 새로운 방향을 제 시한다.

목차

1. 텍스트 마이닝을 넘어서 : RAG 기반 챗봇과 문학 분석의 가능성
2. 연구대상
3. RAG 기반 챗봇 구축과 디지털 인문학
4. 작품 분석
5. 맺음말
<참고문헌>
<국문초록>

키워드

텍스트 마이닝 자연어 처리 RAG 기반 챗봇 문학 분석 자동화 융복합 연구 비문학 전공자 Text mining Natural Language Processing RAG-based chatbot Automated literary analysis Convergence research Non-literature majors

저자

  • 하두진 [ Ha Doo Jin | 경기대학교, 중어중문전공, 조교수 ] 주저자
  • 박민준 [ Park Min Jun | 덕성여대, 중어중문학전공, 조교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    경기대학교 인문학연구소
  • 설립연도
    1996
  • 분야
    인문학>기타인문학
  • 소개
    본 인문학연구소는 1996년 12월 설립 이래 인문학 전반에 걸친 폭 넓은 연구와 과제를 수행해오고 있으며, 연구소 내에 인성교육연구실, 지역문화연구실, 전통문화콘텐츠연구실, 아동문학연구실의 4개 연구실을 두어 각 연구실마다 교육부, 문화체육부 과제, 정부 및 지자체 과제, 산업기관 과제 등을 활발하게 수행하고 있다. 본 인문학연구소는 매년 2회 기관지 <시민인문학>을 출판하여 2015년 현재 통권 28호에 이르고 있다. <시민인문학>의 모토는 인문학의 대중화, 인문정신문화의 진흥, 시민 공동체 사회의 실현으로서, 일반 시민, 소외 청소년, 쉼터 노숙인, 노인 등 여러 계층의 시민들을 대상으로 한 인문학 교양교육 실시와 매년 2회의 정기 학술대회와 워크숍을 수행하고 있다. 본 인문학연구소는 대학 내외의 인문사회 연구기관과의 교류, 지자체의 인문학 관련 용역과제 (수원시, 안양시, 광명시 등) 수행과 업무 협약 등을 통해 지역 연계의 시민인문학 사업을 충실히 수행하고 있다. 본 인문학연구소는 경기대학교의 중점연구소로서 연구소 독자적 사무실 운영비, 전임 조교 인건비, 학술대회비 지원 등을 지속적이고 안정적으로 지원받고 있으며, 한국연구재단의 연구교수와 30여명에 이르는 연구원들이 다양한 영역에서의 학제 간 연구를 진행하고 있다. 본 인문학연구소는 다양한 인문학교육 프로그램 개발과 인문교육지도자 연수 시스템 운영, 그리고 자체 홈페이지를 이용한 인문학 플랫폼 개설 등을 통해 대학의 인문학 연구기관으로서의 위상을 세워나가고 있다.

간행물

  • 간행물명
    시민인문학 [Citizen and Humanities]
  • 간기
    반년간
  • pISSN
    2005-7164
  • eISSN
    2713-8526
  • 수록기간
    1990~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 001 DDC 001

이 권호 내 다른 논문 / 시민인문학 제49호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장