Earticle

현재 위치 Home

LLM 기반 AI의 인간 평가 업무 대체 가능성 연구 : Expert AI를 활용한 품질 모니터링 시스템 구축을 중심으로
Exploring the Potential of LLM-Based AI to Replace Human Evaluation Tasks : Focusing on Building a Quality Monitoring System Using Expert AI

첫 페이지 보기
  • 발행기관
    한국경영정보학회 바로가기
  • 간행물
    경영정보학연구 KCI 등재 바로가기
  • 통권
    제27권 제4호 (2025.11)바로가기
  • 페이지
    pp.203-227
  • 저자
    이애리, 허태범
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A476250

※ 기관로그인 시 무료 이용이 가능합니다.

6,300원

원문정보

초록

영어
Recently, the performance of large language models (LLMs) has improved to expert levels. This study proposes a novel approach to building a quality monitoring system utilizing Expert AI (AI acting as an evaluation expert) to overcome the limitations of existing human-centered methods in the customer service (CS) domain. In this study, the quality of responses to customer inquiries generated by a “CS domain-specific Local LLM-based AI” was assessed by human evaluator and Expert AI. For the quality assessment of the Local LLM, its responses were compared with those generated by other LLM-based AIs (ChatGPT and Perplexity) to evaluate the current quality and identify areas for improvement in the Local LLM. After the evaluation, we analyzed the agreement between human and AI evaluators in quality assessment, confirming a high agreement rate of 92.4%. In particular, the agreement rate for detecting Local LLM issues (e.g., poor response quality) was 98.9%, demonstrating that Expert AI can play a key quality control role. This study empirically verified the applicability of Expert AI in the CS field, which requires continuous and real-time quality management. It proposes a method for building an AI-based quality monitoring system that can maximize efficiency in corporate environments.
한국어
최근 대형 언어 모델(LLM)의 성능이 전문가 수준으로 발전하고 있다. 본 연구는 고객서비스 도메인에서 기존 인간 중심 평가 방식의 한계를 극복하고자 Expert AI(평가 전문가로서의 역할을 하는 AI)를 활용한 품질 모니터링 시스템 구축 방안을 새롭게 제시하고자 한다. 본 연구에서는 고객 질문에 대해 “고객서비스 도메인 특화된 Local LLM 기반 AI”로부터 생성된 응답 데이터 결과물의 품질을 인간 평가자와 Expert AI(AI 평가자)가 평가하도록 하였다. 단, Local LLM의 품질 평가 시, 다른 LLM AI(ChatGPT와 Perplexity)로부터 답변된 응답과 비교하여 평가되도록 하여, 도메인 특화로 구축된 Local LLM의 현재 품질 상황과 개선할 점을 파악할 수 있도록 하였다. 평가 수행 이후, 인간 평가자와 Expert AI의 품질 평가에 대한 일치도를 분석한 결과, 92.4%에 달하는 높은 일치율을 확인하였다. 특히 Local LLM의 문제점 탐지(응답 품질이 나쁜 경우)에서는 98.9%의 일치율을 보여, Expert AI가 핵심 품질 관리 역할을 수행할 수 있음을 입증하였다. 본 연구는, 지속적이면서 실시간 품질 관리가 필요한 고객서비스 분야에서 Expert AI의 적용 가능성을 실증적으로 검증함으로써, 실무 환경에서 효율성을 극대화할 수 있는 AI 기반 품질 모니터링 시스템 구축 방안을 제안한다.

목차

요약
Ⅰ. 서론
Ⅱ. 이론적 배경 및 선행 연구 고찰
2.1 고객서비스 도메인에서의 LLM 활용
2.2 LLM 평가 접근법(프레임워크) 등장
Ⅲ. 연구 설계 및 연구 방법론
3.1 Expert AI 정의및연구명제(Proposition)
3.2 연구방법론
Ⅳ. 실험 결과
4.1 품질 평가 데이터 분포
4.2 인간 평가자와 Expert AI의 품질 평가 비교 및 일치도 분석 결과
4.3 연구 명제 검증 및 실무 적용 가능성 검토결과
Ⅴ. 결론
5.1 연구의 핵심 결과 및 학술적 기여
5.2 실무적 시사점
5.3 정책적ㆍ윤리적 시사점
5.4 연구의 한계점 및 향후 연구 제언
참고문헌
<부록>
Abstract

키워드

AI 전문가 시스템 대형 언어 모델 AI의 인간 대체 AI 활용 업무 자동화 고객서비스 품질 평가 Expert AI System Large Language Models (LLMs) AI Replacement of Human Labor AI-Driven Task Automation Customer Service Quality Evaluation

저자

  • 이애리 [ Ae Ri Lee | 상명대학교 경영학부 부교수 ]
  • 허태범 [ Taeboem Heo | ㈜와이즈와이어즈 CTO ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
    1989
  • 분야
    사회과학>경영학
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.

간행물

  • 간행물명
    경영정보학연구 [Information Systems Review]
  • 간기
    계간
  • pISSN
    2982-6551
  • eISSN
    2982-6837
  • 수록기간
    1999~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / 경영정보학연구 제27권 제4호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장