Earticle

현재 위치 Home

오픈소스 기반의 AI 음성·텍스트 변환 기능 개발 및 대통령 음성을 통한 성능 분석
Development of an Open-Source?Based AI Speech-to-Text System and Performance Analysis Using Presidential Speech

첫 페이지 보기
  • 발행기관
    한국기록관리학회 바로가기
  • 간행물
    한국기록관리학회지 바로가기
  • 통권
    제25권 제3호 (2025.08)바로가기
  • 페이지
    pp.243-258
  • 저자
    배민수, 유영문
  • 언어
    한국어(KOR)
  • DOI
    https://doi.org/10.14404/JKSARM.2025.25.3.243
  • URL
    https://www.earticle.net/Article/A471873

※ 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

원문정보

초록

영어
This study developed an open-source?based AI Speech-to-Text (STT) system and analyzed its performance by applying it to presidential speech. While various high-performance STT services are currently commercialized, most are provided online for a fee. However, because of the nature of presidential records, using online services can raise security concerns, and incurring continuous costs for processing accumulating records is inefficient. To address this, the Presidential Archives has developed an offline STT system based on open-source AI models, which is currently under testing and operation. In this study, approximately three hours of presidential audiovisual records were transcribed into text using this function, and the error rate was measured by comparing with the actual text. The results showed that the overall performance is comparable to the latest commercial online services. Additionally, speech rate and recording quality were extracted and analyzed for their correlation with the error rate. Finally, this research highlights the feasibility of applying open-source AI technologies for the utilization of records.
한국어
본 연구는 오픈소스 기반의 AI 음성·텍스트 변환(STT, Speech To Text) 기능을 개발하고 대통령의 음성에 적용하여 그 성능을 분석하였다. 현재 다양한 고성능 STT 서비스가 상용화되어 있으나, 대부분 온라인 환경에서 유료로 제공되고 있다. 하지만 대통령 기록물의 특성상 온라인 서비스의 사용은 보안 등의 문제를 발생할 수 있고, 누적되는 기록물에 지속적인 비용을 들여 처리하는 것은 비효율적이다. 따라서, 대통령기록관은 오픈소스 기반의 AI 모델을 적용한 STT를 개발하고 오프라인으로 시험·운용 중이다. 본 연구에서는 이 기능을 통해 약 3시간 분량의 대통령 시청각기록물을 텍스트로 변환하고, 실제 텍스트와의 비교를 통해 오류율을 측정하였다. 그 결과 전체적으로 최신 상용 온라인 서비스 수준의 성능을 확인하였다. 또한, 발화 속도 및 녹음 품질을 추가로 추출하여 오류율과의 연관성을 분석하였다. 최종적으로 기록물의 활용을 위한 오픈소스 기반 AI 기술의 적용 가능성을 제시한다.

저자

  • 배민수
  • 유영문

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국기록관리학회 [Korean Society of Archives and Records Management]
  • 설립연도
    2000
  • 분야
    복합학>문헌정보학
  • 소개
    한국기록관리학회(Korean Society of Archives & Records Management)는 기록학 영역의 학술 연구를 촉진하고, 기록인 공동체 구성원 및 관련 기관 간의 상호협력 증진을 목적으로 2000년 7월 설립된 전문학술단체입니다. 한국기록관리학회는 한국연구재단 등재지인 <한국기록관리학회지>를 연 4회 발간하고 있으며, 2010년 <기록관리론: 증거와 기억의 과학>, 2018년 <기록관리의 이론과 실제>을 펴내는 등 교육출판에 힘쓰고 있습니다. 또한, 2009년 한국기록학회와 공동으로 제1회 전국기록인대회를 개최한 이래, 2018년 제10회 전국기록인대회를 공동 개최하기에 이르기까지, 기록학의 현장성과 복합성 그리고 실천을 담보한 학술 연구를 증진하고, 기록인 공동체의 소통을 위해 노력하고 있습니다. 한국기록관리학회는 창립 이래, 기록학의 사회적, 역사적 중요성을 잊지 않으며, 기록관리 현장의 문제를 비판하며, 원칙을 바로잡는 일에 물러서지 않았습니다. 불편부당한 기록관리의 원칙을 세우며, 기록인 공동체의 학술적, 실천적 소통의 장이 되고자 하는 한국기록관리학회에 기록인 모두의 성원을 부탁드립니다.

간행물

  • 간행물명
    한국기록관리학회지 [Journal of Korean Society of Archives and Records Management]
  • 간기
    계간
  • pISSN
    1598-1487
  • 수록기간
    2001~2026
  • 십진분류
    KDC 024 DDC 020

이 권호 내 다른 논문 / 한국기록관리학회지 제25권 제3호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장