Earticle

현재 위치 Home

AI Transformation을 위한 Vision Language Model 기반 지능형 문서처리 서비스 플랫폼의 설계 및 구현
Design and Implementation of Intelligent Document Processing Service Platform Based on Vision Language Model for AI Transformation

첫 페이지 보기
  • 발행기관
    한국디지털정책학회 바로가기
  • 간행물
    디지털정책학회지 KCI 등재후보 바로가기
  • 통권
    제4권 제2호 (2025.06)바로가기
  • 페이지
    pp.1-10
  • 저자
    안필용, 이충형
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A468169

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
This study supports corporate AI Transformation (AX) by designing a document processing platform based on a Vision Language Model (VLM) and implementing a prototype using Qwen2.5VL-7B. The platform employs a three-tier microservice architecture with prompt management and modular components to ensure flexibility and scalability. Experiments showed an average information extraction accuracy of 91.7%, and the system demonstrated practical applicability by handling diverse document formats without predefined templates. This research provides an empirical implementation of a prompt-based VLM architecture that overcomes limitations of OCR technologies, offering academic and practical value as a foundation for document automation across sectors such as finance, logistics, and healthcare.
한국어
본 연구는 기업의 AI Transformation(AX)을 지원하기 위해, Vision Language Model(VLM) 기반 지능 형 문서처리 플랫폼을 설계하고, Qwen2.5VL-7B를 활용한 영수증 처리 프로토타입을 구현하였다. 제안된 플랫폼 은 3-Tier 마이크로서비스 아키텍처를 기반으로, 프롬프트 관리 체계와 기능별 모듈화를 통해 유연하고 확장 가능 한 구조를 구현하였다. 실험 결과, 평균 91.7%의 정보 추출 정확도를 달성하였으며, 사전 템플릿 없이 다양한 문서 형식에 대응 가능한 처리 유연성을 바탕으로 실무 적용 가능성을 입증하였다. 본 연구는 OCR 중심 기술의 한계를 보완하는 프롬프트 기반 VLM 아키텍처를 실증적으로 제시하고, 금융·물류·의료 등 산업 전반에서 적용 가능한 문 서 자동화 기반을 제공하였다는 점에서 학문적·실무적 의의를 갖는다.

목차

요약
Abstract
1. 서론
2. 이론적 배경 및 선행연구
2.1 AX와 지능형 문서처리
2.2 지능형 문서처리를 위한 VLM
2.3 지능형 문서처리 필요성
3. 문서처리 서비스 설계
3.1 문서처리 서비스 개요
3.2 서비스 플랫폼 아키텍처
3.3 Frontend Layer 설계
3.4 Service Layer 설계
3.5 Management Layer 설계
4. 구현
4.1 프로토타입 구현 : 영수증 처리 서비스
4.2 다양한 문서 유형으로 확장
4.3 서비스 구현 시 고려사항
5. 결론
REFERENCES

키워드

인공지능 전환 비전언어모델 지능형 문서처리 문서 자동화 비정형 문서 인식 AI Transformation Vision Language Model Intelligent Document Processing Document Automation Unstructured Document Recognition

저자

  • 안필용 [ Pil-Yong Ahn | 온더라이브 부사장 ]
  • 이충형 [ Choong-Hyong Lee | 남서울대학교 메타융합경영학과 부교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국디지털정책학회 [The Society of Digital Policy & Management]
  • 설립연도
    2003
  • 분야
    복합학>과학기술학
  • 소개
    디지털기술 및 산업정책, 디지털경제, 관련 산업의 연구, 전자정부, 디지털정치에 관한 제도적, 정책적 연구, 디지털경영, 전자상거래, e-비즈니스에 관한 실용적 연구, 학술연구지 발간 및 학술대회 개최 등을 통하여 디지털경제 및 디지털경영에 관련되는 국가정책 분야의 연구 및 교류를 촉진하고 국가 및 기업 정보화와 디지털산업의 발전에 공헌한다.

간행물

  • 간행물명
    디지털정책학회지
  • 간기
    월간
  • eISSN
    2951-245X
  • 수록기간
    2022~2026
  • 등재여부
    KCI 등재후보
  • 십진분류
    KDC 569 DDC 620

이 권호 내 다른 논문 / 디지털정책학회지 제4권 제2호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장