구어 일본어 형태소 정보부여를 위한 형태소분석 프로그램의 활용과 문제점
표지보기
발행기관
한국일본언어문화학회 바로가기
간행물
일본언어문화
바로가기
통권
제22집 (2012.09)바로가기
페이지
pp.187-205
저자
손영석 , 이창익
언어
한국어(KOR)
URL
https://www.earticle.net/Article/A280466 복사
※ 기관로그인 시 무료 이용이 가능합니다.
저자의 다른 논문
5,400원
구매하기
인용하기
관심논문등록
원문정보
초록
일본어
大量の発話・発話場面データにもとづいて話者の言語運用の実態が調べられる対談番組のマルチメディア・コーパスを、今後より多面的な分析に活用するため、コーパスにおける40時間分の音声文字化テキストをβ単位に分類し単位ごとに見出し語・品詞・語種を付与・搭載したが、その際、本来書きことばの解析のために開発された形態素解析プログラムを用いたことから、大量の誤解析が発生した。用いたプログラムは形態素解析システム用の日本語辞書“UniDic(1.3.12)”とオープンソース形態素解析エンジン“MeCab(0.993)”である。そして、その解析結果の精密度を測るためにサンプリング調査を行ったところ、β単位への分類及び各種の言語情報の付与は約97.52%の精密度で自動的に解析できるということ、その精密度は対談番組の対談形式によって大きく異なるということ、誤解析は主として「終助詞・間投助詞」「擬音語・擬態語」「感情表出表現」「未登録語(固有名詞・方言など)」「語形変化が伴った語」「非語彙的な母音・子音の拡張及び縮約が伴った語」のいずれかの言語項目において頻出するということなどが明らかになった。このように誤解析のパターンを今後とも精密に記述していけば、話しことばに十全に対応できる形態素解析プログラムの開発や、誤解析の発生を軽減させながら大量かつ精密に音声を文字化する方法論の模索にもつながると考える。
목차
1. 들어가기 2. 『대담방송 멀티미디어 코퍼스』 3. 형태소분석 프로그램을 활용한언어정보의 부여 4. 형태소분석 프로그램을 활용한언어정보 부여의 문제점 4.1 대담방송의 대담형식별 오분류 4.2 오분류 빈출 언어그룹 및 요인 5. 마치며 [參考文獻] <要旨>
키워드
形態素解析
話しことば
見出し語
言語情報の付与
マルチメディア・コーパス
저자
손영석 [ 제주대학교 강사 ]
이창익 [ 제주대학교 교수 ]
간행물 정보
발행기관
발행기관명
한국일본언어문화학회
[Japanese Language & Culture Association of Korea]
설립연도 2001
분야 인문학>일본어와문학
소개 본 학회는 일본어학 및 일본문학은 물론, 일본의 정치, 경제, 문화, 사회 등의 일본학 전반에 걸친 연구 및 일본의 언어, 문화를 매체로 한 한국과의 비교 연구를 대상으로 하고 있다. 본 학회는 회원들에게 연구 발표 및 정보 교환의 기회를 부여하고 나아가 한국에서의 바람직한 일본 연구 자세를 확립하는 것을 주된 목표로 하고 있다.
간행물
표지보기
관심저널 등록
간행물명
일본언어문화
[Journal of japanese Language and Culture]
간기 계간
pISSN 1598-9585
수록기간 2002~2025
등재여부 KCI 등재
십진분류 KDC 730 DDC 495
이 권호 내 다른 논문 / 일본언어문화 제22집
함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.
0 개의 논문이 장바구니에 담겼습니다.
장바구니로 이동
계속해서 검색하기