Earticle

현재 위치 Home

인공지능/빅데이터

합성 신분증 데이터 기반 경량 광학 문자 인식기
Lightweight Optical Character Recognition based on Synthetic Identification Card

첫 페이지 보기
  • 발행기관
    대한산업경영학회 바로가기
  • 간행물
    산업융합연구(구 대한산업경영학회지) KCI 등재 바로가기
  • 통권
    제24권 제5호 (2026.05)바로가기
  • 페이지
    pp.11-19
  • 저자
    서상민
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A485020

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
This note proposes an optical character recognition to read content of a document in the form of an identification card. In the proposed method, virtual synthetic identification cards are used without real personal information. The synthesized identification cards are used as for datasets, a deep learning based optical character recognizer is proposed. First, we curate a dataset to read to read string on the synthetic identification cards, design and train a deep learning-based optical character reader, and then evaluate its performance. When creating the dataset, since real personal information was unavailable, 10,000 virtual datasets were created and divided into training, evaluation, and experimentation sections. The reader model was built using a convolutional recurrent neural network, and was designed as a lightweight model with mobility in mind, ensuring it is not restricted by location. The designed model was trained by setting connectionist time series classification as the loss function, and the gradual loss reduction and resulting gradual performance increase were confirmed, showing the applicability of the proposed method as a lightweight character recognizer.
한국어
본 논문은 신분증 형식을 갖는 문서의 내용을 판독하기 위한 광학 문자 인식기를 제안한다. 제안하는 방법에서는 실제 개인정보가 담긴 신분증을 사용하지 않고 가상의 합성 신분증을 사용한다. 합성된 신분증들은 데이터셋으로 사용되며, 딥러닝 기반의 광학 문자 인식기를 제안한다. 우선, 문자열 판독을 위한 데이터셋을 먼저 만들고, 딥러닝 기반의 광학 문자 판독기를 설계 및 훈련을 한 후 그 성능을 평가한다. 데이터셋을 만들 때, 실제 개인정보를 이용할 수 없기 때문에, 가상의 데이터 셋 10,000개를 만들고, 이를 훈련, 평가, 실험용으로 나누어서 사용한다. 문자 판독기 모델은 합성곱 순환 신경망으로 만들었으며, 장소에 구애받지 않기 위해 이동성을 고려하여, 경량 모델을 설계하였다. 설계된 모델은 연결주의 시계열 분류를 손실 함수로 설정하여 훈련을 진행하였고 점진적인 손실 감소와 그로 인한 점진적인 성능 증가를 확인하여, 제안하는 방법이 경량 문자 인식기로 적용 가능성이 있음을 보였다.

목차

요약
Abstract
1. 서론
2. 이론적 배경 및 선행연구
2.1 딥러닝 기반 문서 인식 및 OCR 연구
2.2 개인정보 문서와 신분증 데이터 활용 제약
2.3 합성 데이터 기반 이미지 생성 연구
2.4 본 연구의 차별성
3. 광학 문자 인식기 설계
3.1 데이터셋 설계
3.2 광학 문자 인식기 설계
3.3 손실 함수와 성능 지표
4. 실험 결과
5. 결론
REFERENCES

키워드

합성 데이터 신분증 문서 광학 문자 인식 딥러닝 문자 오류율 문장 오류율 연결주의 시계열 분류 합성곱 순환 신경망 Synthetic data identity document optical character recognition generative adversarial network character error rate sentence error rate connectionist temporal classification convolutional recurrent neural network

저자

  • 서상민 [ Sangmin Suh | 강원대학교 정보통신공학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    대한산업경영학회 [Dae Han Society of Industrial Management]
  • 설립연도
    2003
  • 분야
    복합학>과학기술학
  • 소개
    본 학회는 산업체·학계·연구소 등의 회원 상호간에 정보교환 및 지원을 통하여 산업경영에 관한 학문발전을 도모하고 산학에 관한 긴밀한 네트워크를 형성하여 기업의 경쟁력을 강화시키는데 그 설립 목적을 두고 있다.

간행물

  • 간행물명
    산업융합연구(구 대한산업경영학회지) [Journal of Industrial Convergence]
  • 간기
    월간
  • pISSN
    2635-8875
  • 수록기간
    2003~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 323 DDC 338

이 권호 내 다른 논문 / 산업융합연구(구 대한산업경영학회지) 제24권 제5호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장