경량화된 비전-언어 모델의 효율적 학습을 위한 자기지도학습 설계

이효재; 우덕건; 김형오

216.73.216.134

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

Poster Session 차세대컴퓨팅 기술 전 분야(인공지능, 딥러닝 응용)

경량화된 비전-언어 모델의 효율적 학습을 위한 자기지도학습 설계
Self-Supervised Learning Design for Efficient Training of Lightweight Vision-Language Models

발행기관

한국차세대컴퓨팅학회 바로가기
간행물

한국차세대컴퓨팅학회 학술대회 바로가기
통권

2025 한국차세대컴퓨팅학회 춘계학술대회 (2025.05)바로가기
페이지

pp.94-96
저자

이효재, 우덕건, 김형오
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A468914

원문정보

초록

한국어: 본 논문은 연안 해역의 CCTV 영상 데이터를 분석하여 위험 상황(예: 고립된 요구조자, 산불, 태풍 등)을 인지하고, 이를 자연어로 설명할 수 있는 경량 비전-언어 모델(VLM) 개발을 목표로 한다. 대규 모 라벨링 없이도 학습 가능한 자기지도학습(Self-Supervised Learning) 기법을 적용하여, 해양 환경 특화 영상 표현을 학습하고, 이후 생성형 언어모델을 결합해 장면을 기술하는 시스템을 제안한다. 특 히, MoCo, DINOv2 등 최신 대조학습 기반 자기지도 모델과 BLIP, Flamingo 등 멀티모달 학습 기법 을 분석하고, 이를 경량화 전략(지식 증류, 양자화 등)과 연계하여 실시간 추론이 가능한 구조를 설계 한다. 문헌 기반 실험 고찰을 통해, 제안된 방법이 적은 라벨로도 높은 설명 성능을 보일 가능성이 높 으며, 실제 연안 감시 시스템에 적용할 경우 위험 탐지 신뢰성과 맥락 이해력이 향상될 것으로 기대된 다. 향후 실제 구현과 도메인 특화 데이터 확보, 시간적 서술 확장 등 과제를 논의하며 본 연구의 실 용성과 확장성을 제시한다.

요약
1. 서론
2. 관련 연구
2.1 자기지도 학습을 통한 시각 표현 학습
2.2 멀티모달 비전-언어 모델
2.3 경량 비전-언어 모델
3. 제안 방법론
3.1. 문제 정의 및 전체 개요
3.2. 자기지도학습 기반 사전훈련
3.3 비전-언어 결합 및 세부 학습 전략
4. 실험적 고찰
5. 결과
참고문헌

키워드

비전-언어 모델 자기지도학습 경량화 연안 CCTV 영상 상황 인지

저자

이효재 [ Hyo Jae Lee | 한국폴리텍대학 성남캠퍼스 인공지능소프트웨어과 ]
우덕건 [ Deok-Gun Woo | 한국폴리텍대학 충주캠퍼스, 지능형기계과 ]
김형오 [ Hyung O Kim | 한국폴리텍대학 성남캠퍼스 인공지능소프트웨어과 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
설립연도
2005
분야
공학>컴퓨터학
소개
본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

간행물명

한국차세대컴퓨팅학회 학술대회
간기
반년간
수록기간
2021~2025
십진분류
KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2025 한국차세대컴퓨팅학회 춘계학술대회

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

경량화된 비전-언어 모델의 효율적 학습을 위한 자기지도학습 설계
Self-Supervised Learning Design for Efficient Training of Lightweight Vision-Language Models

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2025 한국차세대컴퓨팅학회 춘계학술대회

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

경량화된 비전-언어 모델의 효율적 학습을 위한 자기지도학습 설계 Self-Supervised Learning Design for Efficient Training of Lightweight Vision-Language Models

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2025 한국차세대컴퓨팅학회 춘계학술대회

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

경량화된 비전-언어 모델의 효율적 학습을 위한 자기지도학습 설계
Self-Supervised Learning Design for Efficient Training of Lightweight Vision-Language Models