Earticle

다운로드

다중 모달리티 활용을 위한 심층적 프롬프트 엔지니어링 분석
In-Depth Prompt Engineering Analysis for Multi-modality Utilization

  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 권호(발행년)
    2024 한국차세대컴퓨팅학회 춘계학술대회 (2024.04) 바로가기
  • 페이지
    pp.322-325
  • 저자
    오주희, 이상웅
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A468792

원문정보

초록

한국어
최근 멀티모달 연구가 활발해지면서, 이미지-텍스트, 영상-텍스트, 오디오-텍스트 등 다양한 개념을 통합하여 인간처럼 사물을 받아들이는 기술이 발전하고 있다. 그 중에서도, contrastive languageimage pretraining 은 제로샷 학습과 대조 학습을 통해 라벨을 학습하지 않고도 이미지와 텍스트 간의 관계를 학습하여 이미지 분류를 하는 대표적인 대규모 언어 모델로, 다양한 분야에서 활용되고 있다. 그러나, 대규모 언어 모델의 성능은 프롬프트 엔지니어링에 크게 영향을 받는다. 이에 따라, 본 논문에서는 contrastive language-image pretraining 의 추론 과정에서 프롬프트 엔지니어링을 분석하고, 능숙한 활용을 위한 필수 고려 사항과 전략을 제시한다. 이를 통해, 사용자들이 contrastive language-image pretraining 을 더욱 효과적으로 활용할 수 있을 것으로 기대된다

목차

요약
1. 서론
2. 본론
2.1 데이터셋 및 실험 환경
2.2 실험 결과
3. 결론
참고문헌

저자

  • 오주희 [ AI·소프트웨어학과 가천대학교 ]
  • 이상웅 [ AI·소프트웨어학부 가천대학교 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국차세대컴퓨팅학회 학술대회
    • 간기
      반년간
    • 수록기간
      2021~2025
    • 십진분류
      KDC 566 DDC 004