Improving Reliability and Consistency in Korean–Chinese Legal Translation : Terminology Control and Error Analysis in Neural Machine Translation
한–중 법률 번역에서의 신뢰성과 일관성 향상 : 신경망 기계번역에서의 용어 통제와 오류 분석
Legal translation between Korean and Chinese poses unique challenges due to the complexity of legal terminology, strict requirements for consistency, and the scarcity of domain-specific bilingual resources. While recent advances in neural machine translation (NMT) have improved overall translation performance, issues of terminology reliability and error distribution remain unresolved, limiting the practical applicability of such systems in legal contexts. This study proposes a terminology-aware translation framework that integrates a bilingual legal glossary into both the decoding and post-editing stages of an mBART-based NMT model. In addition, a comprehensive error analysis framework is introduced to classify and quantify common legal translation errors, including semantic inconsistency, grammatical inaccuracies, and terminological deviations. Experiments on a Korean–Chinese legal corpus demonstrate that the proposed approach not only enhances conventional evaluation metrics such as BLEU and TER, but also achieves higher terminology accuracy and consistency compared with baseline systems. These findings highlight the importance of domain-specific terminology control and systematic error analysis in improving the reliability of machine-assisted legal translation, thereby contributing to more trustworthy applications in judicial and legislative contexts.
한국어
한–중 법률 번역은 법률 용어의 복잡성, 일관성에 대한 엄격한 요구, 그리고 도메인 특화 이중언어 자원의 부족으로 인해 고유한 어려움을 가진다. 최근 신경망 기계번역(NMT)의 발전으로 전반적인 번역 성능은 향상되었으나, 용어의 신뢰성과 오류 분포 문제는 여전히 해결되지 않아 법률 분야에서의 실제 적용 가능성을 제한하고 있다. 본 연구는 mBART 기반 NMT 모델의 디코딩 단계와 사후편집 단계에 이중언어 법률 용어집을 통합하는 용어 인식 번역 프레임워크를 제안한다. 또한 의미 불일치, 문법 오류, 용어 일탈 등을 포함한 주요 법률 번역 오류를 분류하고 정량화하기 위한 종합적인 오류 분석 체계를 제시한다. 한–중 법률 코퍼스를 이용한 실험 결과, 제안된 방법은 BLEU 및 TER과 같은 기존 평가 지표를 향상시킬 뿐만 아니라, 기준 시스템에 비해 더 높은 용어 정확도와 일관성을 달성함을 보여준다. 이러한 결과는 도메인 특화 용어 통제와 체계적인 오류 분석이 기계 기반 법률 번역의 신뢰성을 향상시키는 데 핵심적임을 시사하며, 사법 및 입법 분야에서 보다 신뢰할 수 있는 활용을 가능하게 한다.
목차
요약 ABSTRACT I. INTRODUCTION II. Related Work III. Methodology 1. Baseline NMT Model 2. Terminology Glossary Construction 3. Constrained Decoding 4. Post-editing and Terminology Checking 5. Error Analysis Framework IV. Experiment and Results 1. Experimental Setup 2. Evaluation Metrics 3. Results on Translation Quality 4. Results on Terminology Accuracy 5. Error Distribution Analysis 6. Human Evaluation 7. Discussion of Results V. Discussion 1. Practical Significance in Legal Translation 2. Contributions Beyond Conventional Metrics 3. Limitations of the Current Framework 4. Future Directions 5. Comparison with LLM-based Legal Translation V. Conclusion References
한국인공지능교육학회 [Korean Association of Artificial Intelligence Education]
설립연도
2019
분야
사회과학>교육학
소개
인공지능 기반의 융합 사회의 도래로 사회 전반에서 인공지능의 소양과 역량에 대한 요구가 증가하고 있습니다. 알파고 이후 인공지능은 우리 생활의 일부가 되고 있고 인공지능 기술이 융합 산업의 핵심으로 대두되었습니다. 인공지능기술이 다른 분야를 만났을 때 창출되는 가치는 자동차, 반도체, 스마트폰의 부가가치를 모두 합친 것보다 초월하고 있고 인공지능 역량을 가진 인재는 세상의 변화를 주도하는 막강한 영향력을 갖게 되었습니다.
이러한 인재의 양성은 혁신 기업의 존망을 좌우하게 되었고 국가의 경쟁력으로 이어지고 있습니다. 이것이 인공지능교육의 필요성이며 이를 이끌 단체로서 인공지능교육학회가 있습니다.
한국인공지능교육학회는 인공지능 기술과 융합적 역량을 가진 인재를 양성하고 미래 사회에서 인공지능이 인간을 위한 기술로 전개될 수 있도록 교육의 기반을 마련하고자 합니다. 학회에서는 인공지능에 관한 산학연 연계의 학문을 발전시키고 국가 발전에 기여하는 인재를 양성하는 등 다양한 방면에서 인공지능교육의 발전을 위해 노력하겠습니다. 또한 글로벌 인공지능과 융합 기술 분야에서 우리나라가 선도할 수 있도록 다양한 연구와 학술활동 그리고 국내외 공유의 장을 만들어 가도록 하겠습니다 .
간행물
간행물명
인공지능연구 논문지 [Journal of The Korean Association of Artificial Intelligence Education]