Earticle

현재 위치 Home

멀티모달 정보와 계층 구조를 반영한 장면 인지 기반의 영상 요약

첫 페이지 보기
  • 발행기관
    한국경영정보학회 바로가기
  • 간행물
    한국경영정보학회 정기 학술대회 바로가기
  • 통권
    2025 경영정보관련 학회 춘계통합학술대회 (2025.05)바로가기
  • 페이지
    pp.234-237
  • 저자
    이앞길, 최근호, 김건우
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A472644

※ 기관로그인 시 무료 이용이 가능합니다.
※ 학술발표대회집, 워크숍 자료집 중 4페이지 이내 논문은 '요약'만 제공되는 경우가 있으니, 구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

4,000원

원문정보

초록

한국어
2024년 기준 전 세계 인터넷 사용자 중 92%가 매월 온라인 비디오를 시청하며, 주간 평균 시청 시간은 17시간에 달한다. 이처럼 영상 콘텐츠의 양이 기하급수적으로 증가하면서, 정보 과잉 속에서 핵심 내용을 빠르게 파악하기 어려워지고 있다. 이에 따라 영상 요약 기술의 필요성이 더욱 강조되고 있다. 기존 영상 요약 기법은 주로 프레임 단위 중요도 예측에 집중하지만, 영상의 시간적 구조나 의미 있는 사건을 충분히 반영하지 못하는 한계가 있다. 실제 영상은 프레임(frame), 샷(shot), 장면(scene), 시퀀스(sequence)로 이어지는 복합적 서사 구조를 가지므로, 시간적 흐름이나 사적 구조를 가지며, 이 구조를 고려한 요약은 중복을 줄이고 맥락을 보존하는데 중요하다. 본 연구는 샷과 장면 경계, 멀티모달 이벤트를 탐지하고 어텐션 기반으로 서사 흐름을 반영하는 장면 인지 기반 요약 프레임워크를 제안한다.

목차

Abstract
Introduction
Related Work
영상 요약
멀티모달 영상 요약
샷 및 장면 분할
트랜스포머 기반 영상 요약 기법
Proposed Method
Experiments and Results
Conclusion
References

키워드

Video Summarization Scene Detection shot Detection Multimodal Transformer

저자

  • 이앞길 [ 국립한밭대학교 일반대학원 경영학과 박사과정 ]
  • 최근호 [ 국립한밭대학교 융합경영학과 부교수 ]
  • 김건우 [ 국립한밭대학교 융합경영학과 교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
    1989
  • 분야
    사회과학>경영학
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.

간행물

  • 간행물명
    한국경영정보학회 정기 학술대회 [KMIS Conference]
  • 간기
    반년간
  • 수록기간
    1990~2025
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / 한국경영정보학회 정기 학술대회 2025 경영정보관련 학회 춘계통합학술대회

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장