Earticle

다운로드

최신 비전 트랜스포머 기반 객체 탐지 모델 연구
A Study on Object Detection Model Based on Latest Vision Transformer

원문정보

초록

한국어
객체 탐지 기술은 인공지능 기술 중에서 가장 많이 활용되는 분야 중 하나이며, 실사용 목적의 객체 탐지 모델에서 성능 최적화는 매우 중요한 문제이다. 최근 객체 탐지 연구에서는 모델 전체의 정확도와 속도 향상보다는 동일한 백본에서의 탐지 모듈 성능 개선에 초점이 맞춰져 있다. 본 연구에서는 최신 비전 트랜스포머 모델을 기존 연구에 결합하여 객체 탐지 모델의 성능을 최적화하는 방안을 제시한다. 이를 위해 Deformable Detection Transformer 모델의 백본을 Swin Transformer 로 교체하고, 매칭 비용과 손실 함수에 사용되는 지표를 Generalized Intersection over Union 에서 Complete Intersection over Union 로 교체한다. 이를 통해 최신 비전 연구와 객체 탐지 연구의 간극을 줄이면서, 객체 탐지 모델의 성능과 수렴 속도를 향상시킬 수 있는 방안을 탐색한다. 제안하는 모델의 성능을 검증하기 위해 객체 탐지 분야의 대표적인 데이터셋 중 하나인 COCO 데이터셋을 활용하며, 기존의 Deformable Detection Transformer 모델과 비교하여 성능을 비교한다.

목차

요약
1. 서론
2. 관련연구
2.1 Deformable DETR
2.2 CIoU
3. 실험방법
3.1 데이터셋
3.2 실험 환경
4. 실험결과
5. 결론
Acknowledgement
참고문헌

저자

  • 최찬영 [ AI·소프트웨어학과 가천대학교 ]
  • 오주희 [ AI·소프트웨어학과 가천대학교 ]
  • 안성윤 [ AI·소프트웨어학과 가천대학교 ]
  • 장윤영 [ AI·소프트웨어학과 가천대학교 ]
  • 아브랄 [ AI·소프트웨어학과 가천대학교 ]
  • 이상웅 [ AI·소프트웨어학부 가천대학교 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국차세대컴퓨팅학회 학술대회
    • 간기
      반년간
    • 수록기간
      2021~2025
    • 십진분류
      KDC 566 DDC 004