최근 빅데이터와 소셜미디어의 대두로 많은 정보를 어떻게 활용하는 것에 대한 연구가 많이 되고 있 다. 이에 본 연구는 누구나 사용 가능한 한글 자연어처리 API 를 구축하여 개발과 연구에 활용을 할 수 있도록 하였다(오픈한 글, www.openhangul.com). 선행 연구를 보면 다른 언어에 비해 어미나 조사와 같은 문법적 형태가 발달한 교착어인 한국어는 자연어처리가 어려워 정보화나 정보시스템에의 활용이 미흡한 실정이 다. 본 연구는 총 517,178(+)의 국어 단어 중 명사, 형용 사, 동 사, 부사와 같은 단어들을 우선순위로 하여 집단지성을 이용한 폭소노미 기반의 감성어 사전을 구축하는 프로젝트를 진행하여 문서의 긍/부정 분석 및 자연어 처리에 응용하게 하였다. 테스트를 한 결과 집단지성이 판단한 단어의 의미와 사전적 의미에 미묘한 괴리를 발견했으며 이는 정적인 사전적 의미와는 달리 본 연구의 감성어 사전은 시간적인 개념을 포함한 동적인 사전이기 때문이며 이는 국어학뿐만 아니라 융합학문적으로도 큰 의의가 있다고 본 다. 본 연구에서 구축한 서비스는 집단지성를 한글 감성어 사전 구축에 사용한 새로운 시도가 향후 한글 자연어처리의 발전에 새로운 방향과 시사점을 제시를 할 수 있을 것이라 기대한다.
목차
초록 Ⅰ. 서론 Ⅱ. 연구설계 2-1 사전 데이터 설계 2-2 우선 순위 단어의 형태 선별 2-3 단어들의 감성 태그 및 카테고리 분류 2-4 데이터 수집 2-5 감성의 깊이 표현 Ⅲ. 연구결과 및 실무 활용 3-1 감성어 사전 (API) 3-2 키워드 카테고리 분석 (API) 3-3 기타 (API) Ⅳ. 연구결과에 대한 기대효과 및 활용방안 References
키워드
한글자연어처리오픈API감성분석감성어 사전집단지성크라우드소싱빅데이터폭소노미
저자
안정국 [ Graduate School of Information, Yonsei University ]
김희웅 [ Graduate School of Information, Yonsei University ]