이관 기록물 분류 자동화를 위한 목록 기반 이상치 판별 학습데이터 구축
Building the Outlier Candidate Discrimination Training Data based on Inventory for Automatic Classification of Transferred Records
Electronic public records are classified simultaneously as production, a preservation period is granted, and after a certain period, they are transferred to an archive and preserved. This study intends to find a way to improve the efficiency in classifying transferred records and maintain consistent standards. To this end, the current record classification work process carried out by the National Archives of Korea was analyzed, and problems were identified. As a way to minimize the manual work of record classification by converging the required improvement, the process of identifying outlier candidates based on a list consisting of classified information of the transferred records was proposed and systemized. Furthermore, the proposed outlier discrimination process was applied to the actual records transferred to the National Archives of Korea. The results were standardized and constructed as a training data format that can be used for machine learning in the future.
한국어
전자적으로 생산된 공공기록물은 생산과 동시에 편철되고 보존기간이 부여되며 일정기간이 지나면 영구기록물관리기관으로 이관되어 보존된다. 이관 시 기록물관리 담당자가 기록물 분류정보를 확인하고 품질을 일정 수준으로 유지토록 해야 하지만, 이관된 기록물의 분류는 기록물 정리/기술 업무로 편성되어 있고, 대부분의 정리/기술 업무는 수작업에 의존하고 있어 당해 연도에 처리해야 할 기록물 수량을 맞추기 어려운 실정이다. 이에 본 연구는 이관 기록물 분류 업무의 효율화와 일관된 기준을 유지하기 위한 방안을 제안하고자 한다. 이를 위해 먼저 국가기록원에서 수행하고 있는 현행의 기록분류 업무 프로세스를 분석하고 개선 요구사항을 수렴하여 분류 업무의 수작업을 최소화하기 위한 방안으로 이관된 기록물의 편철 정보, 즉 목록에 기반한 분류 이상치 후보를 판별하는 과정을 도출⋅체계화하였다. 나아가 제안한 이상치 판별 프로세스를 실제 국가기록원으로 이관된 기록물을 대상으로 적용하고, 그 결과를 규격화하 여 추후 기계학습에 활용 가능한 학습데이터 형식으로 구축하였다. 본 연구의 궁극적인 목적은 지능형 전자기록 관리 환경 구축을 위한 사전 단계로, 기록관리 업무 내 기계학습 기법이 적용 가능한 문제 유형을 선별하고 자동화하는 방안을 모색하고자 한다.
목차
초록 ABSTRACT 1. 서론 1.1 연구 배경 1.2 선행연구 2. 기록분류 관련 업무 현황 분석 2.1 영구기록물관리기관 업무 운영 절차 2.2 심층면담 3. 이관 기록물 분류 이상치 판별 자동화 3.1 분류 이상치 판별 프로세스 3.2 분류 이상치 판별 학습데이터 구축 3.3 분류 이상치 판별 자동화 방안 4. 결론 참고문헌
한국기록관리학회 [Korean Society of Archives and Records Management]
설립연도
2000
분야
복합학>문헌정보학
소개
한국기록관리학회(Korean Society of Archives & Records Management)는 기록학 영역의 학술 연구를 촉진하고, 기록인 공동체 구성원 및 관련 기관 간의 상호협력 증진을 목적으로 2000년 7월 설립된 전문학술단체입니다.
한국기록관리학회는 한국연구재단 등재지인 <한국기록관리학회지>를 연 4회 발간하고 있으며, 2010년 <기록관리론: 증거와 기억의 과학>, 2018년 <기록관리의 이론과 실제>을 펴내는 등 교육출판에 힘쓰고 있습니다.
또한, 2009년 한국기록학회와 공동으로 제1회 전국기록인대회를 개최한 이래, 2018년 제10회 전국기록인대회를 공동 개최하기에 이르기까지, 기록학의 현장성과 복합성 그리고 실천을 담보한 학술 연구를 증진하고, 기록인 공동체의 소통을 위해 노력하고 있습니다.
한국기록관리학회는 창립 이래, 기록학의 사회적, 역사적 중요성을 잊지 않으며, 기록관리 현장의 문제를 비판하며, 원칙을 바로잡는 일에 물러서지 않았습니다. 불편부당한 기록관리의 원칙을 세우며, 기록인 공동체의 학술적, 실천적 소통의 장이 되고자 하는 한국기록관리학회에 기록인 모두의 성원을 부탁드립니다.
간행물
간행물명
한국기록관리학회지 [Journal of Korean Society of Archives and Records Management]