Earticle

현재 위치 Home

구어 일본어 형태소 정보부여를 위한 형태소분석 프로그램의 활용과 문제점

첫 페이지 보기
  • 발행기관
    한국일본언어문화학회 바로가기
  • 간행물
    일본언어문화 바로가기
  • 통권
    제22집 (2012.09)바로가기
  • 페이지
    pp.187-205
  • 저자
    손영석, 이창익
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A280466

※ 기관로그인 시 무료 이용이 가능합니다.

5,400원

원문정보

초록

일본어
大量の発話・発話場面データにもとづいて話者の言語運用の実態が調べられる対談番組のマルチメディア・コーパスを、今後より多面的な分析に活用するため、コーパスにおける40時間分の音声文字化テキストをβ単位に分類し単位ごとに見出し語・品詞・語種を付与・搭載したが、その際、本来書きことばの解析のために開発された形態素解析プログラムを用いたことから、大量の誤解析が発生した。用いたプログラムは形態素解析システム用の日本語辞書“UniDic(1.3.12)”とオープンソース形態素解析エンジン“MeCab(0.993)”である。そして、その解析結果の精密度を測るためにサンプリング調査を行ったところ、β単位への分類及び各種の言語情報の付与は約97.52%の精密度で自動的に解析できるということ、その精密度は対談番組の対談形式によって大きく異なるということ、誤解析は主として「終助詞・間投助詞」「擬音語・擬態語」「感情表出表現」「未登録語(固有名詞・方言など)」「語形変化が伴った語」「非語彙的な母音・子音の拡張及び縮約が伴った語」のいずれかの言語項目において頻出するということなどが明らかになった。このように誤解析のパターンを今後とも精密に記述していけば、話しことばに十全に対応できる形態素解析プログラムの開発や、誤解析の発生を軽減させながら大量かつ精密に音声を文字化する方法論の模索にもつながると考える。

목차

1. 들어가기
 2.  『대담방송 멀티미디어 코퍼스』
 3. 형태소분석 프로그램을 활용한언어정보의 부여
 4. 형태소분석 프로그램을 활용한언어정보 부여의 문제점
  4.1 대담방송의 대담형식별 오분류
  4.2 오분류 빈출 언어그룹 및 요인
 5. 마치며
 [參考文獻]
 <要旨>

키워드

形態素解析 話しことば 見出し語 言語情報の付与 マルチメディア・コーパス

저자

  • 손영석 [ 제주대학교 강사 ]
  • 이창익 [ 제주대학교 교수 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국일본언어문화학회 [Japanese Language & Culture Association of Korea]
  • 설립연도
    2001
  • 분야
    인문학>일본어와문학
  • 소개
    본 학회는 일본어학 및 일본문학은 물론, 일본의 정치, 경제, 문화, 사회 등의 일본학 전반에 걸친 연구 및 일본의 언어, 문화를 매체로 한 한국과의 비교 연구를 대상으로 하고 있다. 본 학회는 회원들에게 연구 발표 및 정보 교환의 기회를 부여하고 나아가 한국에서의 바람직한 일본 연구 자세를 확립하는 것을 주된 목표로 하고 있다.

간행물

  • 간행물명
    일본언어문화 [Journal of japanese Language and Culture]
  • 간기
    계간
  • pISSN
    1598-9585
  • 수록기간
    2002~2025
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 730 DDC 495

이 권호 내 다른 논문 / 일본언어문화 제22집

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장