Earticle

현재 위치 Home

ATIS

자전거도로 영상 데이터 합성을 위한 스테이블 디퓨전 모델 미세 조정 기법
Fine-tuning of Stable Diffusion Models for Image Data Synthesis on Bicycle Roads

첫 페이지 보기
  • 발행기관
    한국ITS학회 바로가기
  • 간행물
    한국ITS학회논문지 KCI 등재 바로가기
  • 통권
    제24권 제6호 통권122호 (2025.12)바로가기
  • 페이지
    pp.79-93
  • 저자
    심승보, 이유화, 문재필
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A477112

※ 기관로그인 시 무료 이용이 가능합니다.

4,800원

원문정보

초록

영어
The growing use of bicycles has heightened the importance of video-based monitoring for preventing accidents and detecting hazardous situations on bicycle roads. However, collecting video data that adequately reflects variations in season, illumination, and weather requires substantial time, and the high cost of data labeling further limits the development of effective object-detection models. To address these challenges, this study proposes an image synthesis method that simultaneously incorporates structural constraints and style adaptation. The proposed approach integrates Stable Diffusion with ControlNet and Low-Rank Adaptation (LoRA), enabling unified control of scene structure through mask images and fine-grained style adjustment. A dataset was constructed using real CCTV footage, and three Stable Diffusion–based backbone models were evaluated for their synthesis performance. Fréchet Inception Distance and CLIP-score were used for quantitative assessment, demonstrating that the proposed method achieves superior realism and semantic alignment between images and text. Furthermore, the model successfully generated images reflecting seasonal and weather variations solely through prompt manipulation. This research provides an efficient solution for generating diverse environmental conditions that are difficult to capture in practice, thereby alleviating data scarcity in bicycle-road monitoring and supporting the advancement of nextgeneration object-detection and safety-management technologies.
한국어
자전거 이용 증가와 함께 자전거도로의 사고 예방 및 위험 상황에 대한 영상 기반 모니터링 의 중요성이 더욱 부각되고 있다. 그러나 계절·조도·기상 변화가 충분히 반영된 영상 데이터를 확보하는 데에는 많은 시간이 소요되고, 설상 가상으로 라벨링 비용 또한 높아 객체 탐지 모델 개발에 제약이 발생한다. 본 연구는 이러한 문제를 해결하기 위해 구조적 제약과 스타일 적응 을 동시에 반영하는 영상 합성 기법을 제안하였다. 제안한 방법은 Stable Diffusion 기반 모델에 ControlNet과 Low-Rank Adaptation을 결합하여, 마스크 영상을 통한 구조 제어와 스타일 미세조 정을 통합적으로 수행한다. 실제 CCTV 영상을 기반으로 데이터세트를 구축하고, 세 가지 Stable Diffusion 계열 기저 모델을 대상으로 합성 성능을 비교하였다. 성능 평가는 Fréchet Inception Distance와 CLIP-score를 활용하였으며, 그 결과 제안한 방법이 사실성과 텍스트 정합 성 측면에서 우수한 합성 품질을 달성함을 확인하였다. 또한 텍스트 프롬프트 조작만으로 계 절 및 기상 조건을 반영한 영상 생성이 가능함을 검증하였다. 본 연구는 촬영이 어려운 다양한 환경 조건의 데이터를 효율적으로 생성할 수 있어 자전거도로 모니터링을 위한 데이터 부족 문제 해결에 기여하며, 향후 객체 탐지 및 안전관리 기술의 고도화에 효과적으로 활용될 수 있다.

목차

요약
ABSTRACT
Ⅰ. 서론
1. 자전거 도로 영상 데이터의 필요성
2. 영상 데이터의 증강 및 합성 기법
Ⅱ. 자전거 도로 데이터 합성을 위한 미세 조정 방법
1. 자전거 도로 영상 데이터 세트 구성
2. 영상 합성을 위한 Stable Diffusion 미세 조정 기법
3. 학습 환경 구성
Ⅲ. 실험 결과 분석 및 논의
1. 실험 계획 및 평가 방식
2. 실험 결과 및 분석
Ⅳ. Conclusion
ACKNOWLEDGEMENTS
REFERENCES

키워드

스테이블 디퓨전 컨트롤넷 미세조정 데이터 생성 자전거 도로 모니터링 Stable Diffusion ControlNet Fine-tuning Data generation Bicycle road monitoring

저자

  • 심승보 [ Seungbo Shim | 한국건설기술연구원 지반연구본부 수석연구원 ] 주저자 및 교신저자
  • 이유화 [ Yuhwa Lee | 한국건설기술연구원 도로교통연구본부 연구위원 ] 공저자
  • 문재필 [ Jae-Pil Moon | 한국건설기술연구원 도로교통연구본부 수석연구원 ] 공저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국ITS학회 [The Korean Society of Intelligent Transport Systems]
  • 설립연도
    2002
  • 분야
    공학>교통공학
  • 소개
    ◈ 전문분야간 공동협의, 공동연구를 통한 ITS의 학술적 발전 ◈ 산·학·연 협동체계 구축으로 기술개발 지원 ◈ 정부정책 및 제도 방향에 대한 기술적 자문 ◈ 외국 ITS 관련 학술단체와 기술교류 ◈ 관련전문가 및 기술자의 교육 및 양성

간행물

  • 간행물명
    한국ITS학회논문지 [The Journal of The Korean Society of Intelligent Transport Systems]
  • 간기
    격월간
  • pISSN
    1738-0774
  • eISSN
    2384-1729
  • 수록기간
    2003~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 326 DDC 338

이 권호 내 다른 논문 / 한국ITS학회논문지 제24권 제6호 통권122호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장