요약 Abstract 1. Introduction 2. The parallel corpus and it's pre-processing 3. Ailgning the Parallel Corpus 3.1 Length-Based Methods 3.2 Methods Using Cognates 3.3 Methods Using Words as Lexical Information 3.4 Our method - Using Markups as Cognates 4. Pre-processing before model training - chinese Segmentation and English Expression Extraction 4.1 Chinese Segmentation 4.1 English Expression Extraction 5. Translation Model Training 6. Evaluation and analysis 6.1 Translation model as Lexicons 6.2 Effects of Stop-lists 6.3 Analysis of Errors 7. Summary References
저자
Jian-Yun Nie [ University of Montreal CP. 6128, succursale Centre-ville Montreal, Quebec H3C 3J7 Canada ]
Jiang Chen [ University of Montreal CP. 6128, succursale Centre-ville Montreal, Quebec H3C 3J7 Canada ]
Lab. RALI [ University of Montreal CP. 6128, succursale Centre-ville Montreal, Quebec H3C 3J7 Canada ]
한국어정보학회 [Korean Language Information Science Society]
설립연도
1990
분야
인문학>언어학
소개
학술적인 연구를 통하여 국어정보처리에 관련된 이론 체계를 정립하고, 산업계와의 긴밀한 협동을 통하여 정보처리 기술을 향상 시키면서 정보산업의 성장을 돕고, 대중적인 교육과 홍보를 통하여 발전된 정보 처리의 기술을 보급하므로써 국어의 문화적 가치를 높히고 국어정보 처리 기술의 국제적 지위향상과 표준화에 기여하고자 합니다.