Earticle

현재 위치 Home

가려진 객체 거리 추정을 위한 경량 스테레오 트랜스포머 : STTR-nano
Lightweight Stereo Transformer for Occluded Object Distance Estimation : STTR-nano

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
  • 통권
    Vol.22 No.2 (2026.04)바로가기
  • 페이지
    pp.7-18
  • 저자
    김승현, 송현주
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A484514

원문정보

초록

영어
Accurate object distance estimation is crucial for autonomous systems, yet conventional featurematching methods often suffer from significant performance degradation in occluded environments. To address this challenge, this paper proposes a lightweight stereo transformer, STTR-nano, designed for robust distance estimation even when objects are partially obscured. STTR-nano reduces STTR-light by configuring patch size 8, 3 blocks, 4 heads, and 128 dimensions, while incorporating Flash-Attention to enhance computational efficiency. To evaluate the proposed method, experiments were conducted on the KITTI Raw 2011 dataset, comparing STTR-nano with a feature-matching approach using the SIFT algorithm combined with central disparity after YOLOv8n-based detection. STTR-nano achieved a MAE of 36.15 m, RMSE of 334.69 m, and MRE of 132.19%, showing significant improvements over the SIFT-based approach. In particular, performance improved by about 3.4× in the 20–30 m range and more than 10× in the 10–15% occlusion range. In terms of FPS, STTR-nano did not reach real-time performance compared to the SIFT-based method, but its processing speed was more than three times faster than the original STTR, demonstrating its potential for real-time distance estimation in practical occluded environments.
한국어
객체 거리 추정은 자율 주행 및 로봇 시야 확보의 핵심 기술이나, 객체의 일부가 가려지는 occlusion 환경에서는 기존의 특징점 매칭 방식의 정확도가 급격히 저하되는 문제가 있다. 본 논문은 이러한 환경에서 안정적인 거리 추정을 수행하기 위해 경량 스테레오 트랜스포머 ‘STTR-nano’를 제안한다. STTR-light를 패치 8, 블록 3, 헤드 4, 차원 128로 축소하고 Flash-Attention을 적용해 효율성을 높였다. 제안하는 방식을 평가하기 위하여 KITTI Raw 2011 dataset에서 YOLOv8n 기반 검출 후 특징점 기반 매칭 SIFT 알고리즘 + 중심 시차 비교 방식과 STTRnano를 비교하였다. STTR-nano는 MAE 36.15m, RMSE 334.69m, MRE 132.19%로 SIFT 기반 방식보다 크게 개선되었으며, 특히 20–30m 구간에서 약 3.4배, occlusion 10–15% 구간에서 10배 이상의 성능 향상을 보였다. FPS 측면에서는 SIFT 기반 방식과 비교했을 때 STTR-nano가 실시간에는 미치지 못했으나 기존 STTR 대비 3배 이상의 처리 속도 향상을 달성함으로써 실제 occlusion 환경에서의 실시간 거리 추정 가능성을 확인하였다.

목차

요약
Abstract
1. 서론
2. 관련연구
2.1. 전통적 스테레오 매칭 기법
2.2. 학습 기반 스테레오 매칭 기법
3. 거리 추정 방법
3.1 STTR-nano를 사용한 거리 추정
3.2 SIFT 매칭과 중심 시차를 이용한 거리 추정
3.3 Occlusion 판별 및 최종 거리 추출
4. 실험
4.1 환경 구성 및 dataset
4.2 평가 지표
4.3 결과 및 분석
5. 논의
6. 결론
Acknowledgements
참고문헌

키워드

스테레오 비전 딥러닝 가려진 객체 거리 추정 트랜스포머 Stereo Vision Deep learning Occlusion Object Distance Estimation Transformer

저자

  • 김승현 [ Seunghyun Kim | 숭실대학교 IT대학 컴퓨터학부 ]
  • 송현주 [ Hyunjoo Song | 숭실대학교 IT대학 컴퓨터학부 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.22 No.2

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장