This note proposes an optical character recognition to read content of a document in the form of an identification card. In the proposed method, virtual synthetic identification cards are used without real personal information. The synthesized identification cards are used as for datasets, a deep learning based optical character recognizer is proposed. First, we curate a dataset to read to read string on the synthetic identification cards, design and train a deep learning-based optical character reader, and then evaluate its performance. When creating the dataset, since real personal information was unavailable, 10,000 virtual datasets were created and divided into training, evaluation, and experimentation sections. The reader model was built using a convolutional recurrent neural network, and was designed as a lightweight model with mobility in mind, ensuring it is not restricted by location. The designed model was trained by setting connectionist time series classification as the loss function, and the gradual loss reduction and resulting gradual performance increase were confirmed, showing the applicability of the proposed method as a lightweight character recognizer.
한국어
본 논문은 신분증 형식을 갖는 문서의 내용을 판독하기 위한 광학 문자 인식기를 제안한다. 제안하는 방법에서는 실제 개인정보가 담긴 신분증을 사용하지 않고 가상의 합성 신분증을 사용한다. 합성된 신분증들은 데이터셋으로 사용되며, 딥러닝 기반의 광학 문자 인식기를 제안한다. 우선, 문자열 판독을 위한 데이터셋을 먼저 만들고, 딥러닝 기반의 광학 문자 판독기를 설계 및 훈련을 한 후 그 성능을 평가한다. 데이터셋을 만들 때, 실제 개인정보를 이용할 수 없기 때문에, 가상의 데이터 셋 10,000개를 만들고, 이를 훈련, 평가, 실험용으로 나누어서 사용한다. 문자 판독기 모델은 합성곱 순환 신경망으로 만들었으며, 장소에 구애받지 않기 위해 이동성을 고려하여, 경량 모델을 설계하였다. 설계된 모델은 연결주의 시계열 분류를 손실 함수로 설정하여 훈련을 진행하였고 점진적인 손실 감소와 그로 인한 점진적인 성능 증가를 확인하여, 제안하는 방법이 경량 문자 인식기로 적용 가능성이 있음을 보였다.
목차
요약 Abstract 1. 서론 2. 이론적 배경 및 선행연구 2.1 딥러닝 기반 문서 인식 및 OCR 연구 2.2 개인정보 문서와 신분증 데이터 활용 제약 2.3 합성 데이터 기반 이미지 생성 연구 2.4 본 연구의 차별성 3. 광학 문자 인식기 설계 3.1 데이터셋 설계 3.2 광학 문자 인식기 설계 3.3 손실 함수와 성능 지표 4. 실험 결과 5. 결론 REFERENCES
키워드
합성 데이터신분증 문서광학 문자 인식딥러닝문자 오류율문장 오류율연결주의 시계열 분류합성곱 순환 신경망Synthetic dataidentity documentoptical character recognitiongenerative adversarial networkcharacter error ratesentence error rateconnectionist temporal classificationconvolutional recurrent neural network