Metadata is a crucial component of record management, playing a vital role in properly managing and understanding the record. In cases where automatic metadata assignment is not feasible, manual input by records professionals becomes necessary. This study aims to alleviate the challenges associated with manual entry by proposing a method that harnesses ChatGPT technology for extracting records management metadata elements. To employ ChatGPT technology, a Python program utilizing the LangChain library was developed. This program was designed to analyze PDF documents and extract metadata from records through questions, both with a locally installed instance of ChatGPT and the ChatGPT online service. Multiple PDF documents were subjected to this process to test the effectiveness of metadata extraction. The results revealed that while using LangChain with ChatGPT-3.5 turbo provided a secure environment, it exhibited some limitations in accurately retrieving metadata elements. Conversely, the ChatGPT-4 online service yielded relatively accurate results despite being unable to handle sensitive documents for security reasons. This exploration underscores the potential of utilizing ChatGPT technology to extract metadata in records management. With advancements in ChatGPT-related technologies, safer and more accurate results are expected to be achieved. Leveraging these advantages can significantly enhance the efficiency and productivity of tasks associated with managing records and metadata in archives.
한국어
기록관리에서 메타데이터는 기록을 구성하는 필수 요소 중 하나로 기록물을 적절하게 관리하고 이해하도록 하는데 매우 중요한 역할을 한다. 기록관리 업무에서 메타데이터 요소들의 자동 부여가 불가능할 경우에는 기록전문가가 메타데이터 값을 직접 입력해야 한다. 이러한 업무의 불편함을 개선하기 위해 본 연구에서는 신기술인 챗GPT를 활용하여 기록관리 메타데이터 요소의 추출 방안을 제시하고자 하였다. 챗GPT 기술을 활용하기 위해 파이썬 프로그램과 랭체인 라이브러리를 이용하여 PDF 문서를 제시하고 질문을 통해 기록물의 메타데이터를 추출해보았고, 챗GPT 온라인 서비스를 통해 여러 건의 PDF 문서를 첨부하여 기록물의 메타데이터 요소를 추출해보았다. 그 결과 챗GPT-3.5 turbo를 사용한 랭체인에서는 보안상으로는 안전한 추출 방법이긴 하나 메타데이터의 정확한 요소를 얻기에는 다소 한계가 있었고, 챗GPT-4 온라인 서비스에서는 보안상 중요 문서를 첨부할 수 없지만 비교적 정확한 결과를 추출하였다. 이를 통해 기록관리에서의 메타데이터 추출을 위한 챗GPT 기술 활용의 가능성을 타진할 수 있었고, 챗GPT 관련 기술의 발달에 따라 좀 더 안전하고 정확한 결과 추출이 가능해질 것이다. 이러한 챗GPT의 장점을 활용함으로써 기록관에서 기록 및 메타데이터의 관리적 측면에서 업무의 효율성 및 생산성을 증대시키는데 도움을 줄 수 있을 것이라 기대한다.
한국기록관리학회 [Korean Society of Archives and Records Management]
설립연도
2000
분야
복합학>문헌정보학
소개
한국기록관리학회(Korean Society of Archives & Records Management)는 기록학 영역의 학술 연구를 촉진하고, 기록인 공동체 구성원 및 관련 기관 간의 상호협력 증진을 목적으로 2000년 7월 설립된 전문학술단체입니다.
한국기록관리학회는 한국연구재단 등재지인 <한국기록관리학회지>를 연 4회 발간하고 있으며, 2010년 <기록관리론: 증거와 기억의 과학>, 2018년 <기록관리의 이론과 실제>을 펴내는 등 교육출판에 힘쓰고 있습니다.
또한, 2009년 한국기록학회와 공동으로 제1회 전국기록인대회를 개최한 이래, 2018년 제10회 전국기록인대회를 공동 개최하기에 이르기까지, 기록학의 현장성과 복합성 그리고 실천을 담보한 학술 연구를 증진하고, 기록인 공동체의 소통을 위해 노력하고 있습니다.
한국기록관리학회는 창립 이래, 기록학의 사회적, 역사적 중요성을 잊지 않으며, 기록관리 현장의 문제를 비판하며, 원칙을 바로잡는 일에 물러서지 않았습니다. 불편부당한 기록관리의 원칙을 세우며, 기록인 공동체의 학술적, 실천적 소통의 장이 되고자 하는 한국기록관리학회에 기록인 모두의 성원을 부탁드립니다.
간행물
간행물명
한국기록관리학회지 [Journal of Korean Society of Archives and Records Management]