AI는 한영 번역을 어떻게 평가하는가? 챗GPT-인간 평가의 상관관계와 챗GPT 평가의 특징에 관하여

이선우; 이상빈

216.73.217.2

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

AI는 한영 번역을 어떻게 평가하는가? 챗GPT-인간 평가의 상관관계와 챗GPT 평가의 특징에 관하여
The Potential of ChatGPT as a Translation Evaluator: Characteristics and Comparisons to Human Evaluation.

발행기관

한국외국어대학교 통번역연구소 바로가기
간행물

통번역학연구 KCI 등재 바로가기
통권

제29권 1호 (2025.02)바로가기
페이지

pp.29-51
저자

이선우, 이상빈
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A463256

※ 기관로그인 시 무료 이용이 가능합니다.

6,000원

원문정보

초록

영어: In this study, we carried out a series of experiments to explore how ChatGPT (version 4o) evaluated Korean-English translations. Using two datasets of human translations (n=57) and two datasets of post-edited translations (n=56), all drawn from Lee and Lee (2021), we adopted two evaluation approaches with strict prompt control. In Experiment A, ChatGPT rated the four datasets freely on a five-point scale without specific criteria. In Experiment B, which was conducted concurrently with Experiment A, ChatGPT rated the same datasets using a prescribed, criterion-referenced five-point scale. To assess intra-rater reliability, we repeated both experiments one month later. This study yielded both quantitative and qualitative findings, including the following: (1) ChatGPT’s average scores differed significantly from those of human raters; (2) correlations between human and ChatGPT scores ranged from ‘moderate’ to ‘strong’; (3) the use of the prescribed rating scale improved ChatGPT’s reliability as a rater; (4) ChatGPT exhibited very low intra-rater reliability; and (5) ChatGPT’s self-justifications for its ratings varied in quality, often failing to identify obvious errors.

1. 서론
2. 선행연구 검토
2.1. 챗GPT와 외국어 작문/번역
2.2. 챗GPT를 평가 도구로 활용한 연구
3. 연구 방법
4. 분석 결과
4.1. 정량분석
4.1.1. 평균 비교
4.1.2. 평가자 간의 상관관계
4.1.3. 평가자 내 신뢰도
4.2. 정성분석
4.2.1. 평가 근거와 관련된 특징
4.2.2. 척도에 따른 평가 차이
4.2.3. 챗GPT 평가 사례
5. 결론
참고문헌

키워드

번역평가 포스트에디팅 번역품질 번역교육 번역 평가자로서의 챗GPT translation evaluation MTPE translation quality translation education ChatGPT as a rater

저자

이선우 [ Lee, Sun-Woo | 한국외국어대학교 ]
이상빈 [ Lee, Sang-Bin | 한국외국어대학교 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국외국어대학교 통번역연구소 [Interpreting and Translation Research Institute, Hankuk University of Foreign Studies]
설립연도
1997
분야
인문학>통역번역학

간행물

간행물명

통번역학연구 [Interpreting and Translation Studies]
간기
계간
pISSN
1975-6321
eISSN
2713-8372
수록기간
1997~2026
등재여부
KCI 등재
십진분류
KDC 717 DDC 400

이 권호 내 다른 논문 / 통번역학연구 제29권 1호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

AI는 한영 번역을 어떻게 평가하는가? 챗GPT-인간 평가의 상관관계와 챗GPT 평가의 특징에 관하여
The Potential of ChatGPT as a Translation Evaluator: Characteristics and Comparisons to Human Evaluation.

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 통번역학연구 제29권 1호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

AI는 한영 번역을 어떻게 평가하는가? 챗GPT-인간 평가의 상관관계와 챗GPT 평가의 특징에 관하여 The Potential of ChatGPT as a Translation Evaluator: Characteristics and Comparisons to Human Evaluation.

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 통번역학연구 제29권 1호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

AI는 한영 번역을 어떻게 평가하는가? 챗GPT-인간 평가의 상관관계와 챗GPT 평가의 특징에 관하여
The Potential of ChatGPT as a Translation Evaluator: Characteristics and Comparisons to Human Evaluation.