Enhancing Korean–Chinese Legal Translation in Low-Resource Scenarios Using Back Translation and Transfer Learning

Yanan Zhang; Gilja So

216.73.217.141

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

Research Article

Enhancing Korean–Chinese Legal Translation in Low-Resource Scenarios Using Back Translation and Transfer Learning
역번역과 전이학습을 활용한 저자원 환경에서의 한‧중 법률 번역 성능 향상

발행기관

한국인공지능교육학회 바로가기
간행물

인공지능연구 논문지 KCI 등재후보 바로가기
통권

Vol.6 No.3 (2025.12)바로가기
페이지

pp.132-144
저자

Yanan Zhang, Gilja So
언어

영어(ENG)
URL

https://www.earticle.net/Article/A478580

※ 기관로그인 시 무료 이용이 가능합니다.

4,500원

원문정보

초록

영어: Legal translation between Korean and Chinese faces significant challenges due to complex legal terminology, distinct linguistic structures, and the scarcity of high-quality bilingual corpora. This study proposes an approach to improve neural legal translation in low-resource scenarios by integrating back translation-based data augmentation with transfer learning. Specifically, the multilingual pre-trained mBART model is fine-tuned in two stages: initial fine-tuning with authentic Korean–Chinese legal parallel data, followed by enhanced fine-tuning using pseudo-parallel data generated through back translation and enriched with legal terminology annotations. Experiments on domain-specific datasets demonstrate substantial improvements over baseline Transformer and fine-tuned mBART models, achieving a BLEU score of 34.5 and a TER of 0.42. Human evaluation by bilingual legal experts further confirms enhanced fluency, adequacy, and legal consistency. This work not only advances Korean–Chinese legal neural machine translation in low-resource contexts but also discusses legal implications, including accountability, compliance, and the potential of blockchain for translation traceability. The proposed framework provides a practical foundation for developing reliable AI-assisted legal translation systems.

한국어: 한국어–중국어 법률 번역은 복잡한 법률 용어, 상이한 언어 구조, 그리고 고품질 이중언어 병렬 말뭉치의 부족으로 인해 많은 도전에 직면해 있다. 본 연구는 역번역 기반 데이터 증강과 전이학습을 결합하여 저자원 환경에서의 신경망 법률 번역 성능을 향상시키는 방법을 제안한다. 구체적으로, 다국어 사전학습 모델인 mBART를 두 단계로 미세조정(fine-tuning)한다. 먼저 실제 한국어–중국어 법률 병렬 데이터를 이용해 초기 미세조정을 수행하고, 이후 역번역을 통해 생성된 의사 병렬 데이터에 법률 용어 주석을 결합하여 추가적인 강화 미세조정을 수행한다. 도메인 특화 데이터셋을 활용한 실험 결과, 제안한 방법은 기본 Transformer 및 단순 미세조정된 mBART 모델 대비 유의미한 성능 향상을 보였으며, BLEU 점수 34.5와 TER 0.42를 달성하였다. 또한 이중언어 법률 전문가에 의한 인간 평가 결과, 번역의 유창성, 적합성 및 법적 일관성이 모두 개선됨이 확인되었다. 본 연구는 저자원 환경에서의 한‧중 법률 신경망 기계번역 성능을 향상시킬 뿐만 아니라, 책임성, 준법성, 그리고 번역 이력 추적을 위한 블록체인 활용 가능성 등 법적·제도적 함의도 함께 논의한다. 제안된 프레임워크는 신뢰할 수 있는 AI 기반 법률 번역 시스템 구축을 위한 실용적인 기반을 제공한다.

요약
ABSTRACT
I. INTRODUCTION
II. Related Work
1. Neural Machine Translation in Low-Resource Settings
2. Data Augmentation Techniques
3. Legal Domain Machine Translation
III. Methodology
1. Dataset Collection and Preparation
2. Model Architecture
3. Fine-tuning Strategy
4. Back Translation and Data Augmentation
5. Evaluation Metrics and Framework
IV. Experiment and Results
1. Experimental Environment
2. Automatic Evaluation Results
3. Human Evaluation Results
4. Error Analysis
V. Discussion
1. Accountability and Risk of Translation Errors
2. Compliance and Certification Requirements
3. Blockchain-based Traceability in Legal Translation
V. Conclusion and Future Work
1. Conclusion
2. Future Work
References

키워드

한‧중 법률 번역 저자원 기계번역 신경망 기계번역(NMT) 역번역 데이터 증강 전이학습 mBART 법률 용어 정렬 블록체인 추적성 법률 인공지능 응용 Korean–Chinese legal translation Low-resource machine translation Neural machine translation (NMT) Back translation Data augmentation Transfer learning mBART Legal terminology alignment Blockchain traceability Legal AI applications

저자

Yanan Zhang [ 장아남 | Department of Computer and Information Engineering, Youngsan University ]
Gilja So [ 소길자 | Department of Cyber Security, Youngsan University ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국인공지능교육학회 [Korean Association of Artificial Intelligence Education]
설립연도
2019
분야
사회과학>교육학
소개
인공지능 기반의 융합 사회의 도래로 사회 전반에서 인공지능의 소양과 역량에 대한 요구가 증가하고 있습니다. 알파고 이후 인공지능은 우리 생활의 일부가 되고 있고 인공지능 기술이 융합 산업의 핵심으로 대두되었습니다. 인공지능기술이 다른 분야를 만났을 때 창출되는 가치는 자동차, 반도체, 스마트폰의 부가가치를 모두 합친 것보다 초월하고 있고 인공지능 역량을 가진 인재는 세상의 변화를 주도하는 막강한 영향력을 갖게 되었습니다. 이러한 인재의 양성은 혁신 기업의 존망을 좌우하게 되었고 국가의 경쟁력으로 이어지고 있습니다. 이것이 인공지능교육의 필요성이며 이를 이끌 단체로서 인공지능교육학회가 있습니다. 한국인공지능교육학회는 인공지능 기술과 융합적 역량을 가진 인재를 양성하고 미래 사회에서 인공지능이 인간을 위한 기술로 전개될 수 있도록 교육의 기반을 마련하고자 합니다. 학회에서는 인공지능에 관한 산학연 연계의 학문을 발전시키고 국가 발전에 기여하는 인재를 양성하는 등 다양한 방면에서 인공지능교육의 발전을 위해 노력하겠습니다. 또한 글로벌 인공지능과 융합 기술 분야에서 우리나라가 선도할 수 있도록 다양한 연구와 학술활동 그리고 국내외 공유의 장을 만들어 가도록 하겠습니다 .

간행물

간행물명

인공지능연구 논문지 [Journal of The Korean Association of Artificial Intelligence Education]
간기
연3회
pISSN
2733-404X
수록기간
2020~2026
등재여부
KCI 등재후보
십진분류
KDC 000 DDC 006

이 권호 내 다른 논문 / 인공지능연구 논문지 Vol.6 No.3

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

Enhancing Korean–Chinese Legal Translation in Low-Resource Scenarios Using Back Translation and Transfer Learning
역번역과 전이학습을 활용한 저자원 환경에서의 한‧중 법률 번역 성능 향상

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 인공지능연구 논문지 Vol.6 No.3

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

Enhancing Korean–Chinese Legal Translation in Low-Resource Scenarios Using Back Translation and Transfer Learning 역번역과 전이학습을 활용한 저자원 환경에서의 한‧중 법률 번역 성능 향상

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 인공지능연구 논문지 Vol.6 No.3

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Enhancing Korean–Chinese Legal Translation in Low-Resource Scenarios Using Back Translation and Transfer Learning
역번역과 전이학습을 활용한 저자원 환경에서의 한‧중 법률 번역 성능 향상