The growth of multilingual web content portends the need for cross-language information retrieval. As a solution to this problem, we utilize ML-OntoES(a MultiLingual Ontology-based Extraction System). ML-OntoES enables hybrid keyword and semantic search over domain-specific, semi-structured information. Key ideas of ML-OntoES include monolingual semantic indexing and query interpretation with extraction ontologies and conceptual-level cross-language translation. A prototype implementation, along with experimental work showing good extraction accuracy in multiple languages, demonstrates the viability of the ML-OntoES approach of using multilingual extraction ontologies for cross-language hybrid and semantic search.
한국어
수많은 언어로 작성된 웹 컨텐츠의 증가로 주 언어로 작성된 정보뿐만 아니라 타 언어로 작성된 정보에 대한 검색의 필요성이 중요해지고 있다. 이를 위한 한 방법으로 본 논문에서는 특정 분야의 반구조적 정보에 대한 키워드 검색뿐만 아니라 시맨틱 검색을 지원하는 다국어 온톨리지 기반 추출 시스템인 ML-OntoES(MultiLingual Ontologybased Extraction System)를 활용한다. 다국어 온톨리지 기반 추출 시스템은 온톨리지 추출을 통하여 특정 언어 에 대한 시맨틱 인덱싱과 질의 해석, 개념 단계의 언어들 간의 교차언어 번역으로 다국어 웹 컨텐츠에 대한 질의를 처리한다. 다국어 온톨리지 기반 추출 시스템의 프로토타입 구현을 통해 높은 정확도의 다국어 웹 데이터 추출 성능 을 확인함으로써 교차언어에 대한 키워드 검색과 시맨틱 검색을 위한 다국어 추출 온톨리지를 사용하는 다국어 온톨 리지 기반 추출 시스템의 가능성을 증명한다.