Earticle

현재 위치 Home

Article 4

AI 위험/안전 평가를 위한 오픈소스 프레임워크

첫 페이지 보기
  • 발행기관
    한국컴퓨터통신연구회 바로가기
  • 간행물
    OSIA Standards & Technology Review Journal 바로가기
  • 통권
    제38권 제1호 (2025.03)바로가기
  • 페이지
    pp.31-37
  • 저자
    신성필
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A466101

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

한국어
최근 대규모 언어 모델(LLM, Large Language Model) 기반의 고성능 AI 모델 활용이 확산됨에 따라 편향(Bias), 유 해 콘텐츠(Toxicity), 허위 정보(Misinformation), 개인정보 보호(Privacy), 악의적 활용(Malicious Use) 등의 위험 요소 가 주요한 사회적 문제로 대두되고 있다. 이러한 위험 및 안전 성을 평가하기 위해 다양한 AI 안전성 평가 프레임워크가 개 발되고 있으며, 대표적인 오픈소스 프레임워크로 Inspect, Moonshot, Dioptra, Garak 등이 있다. 본 논문에서는 특히 LLM 모델의 위험 및 안전성 벤치 마크에 특화된 Inspect와 Moonshot을 비교 분석하고, Moonshot을 활용한 LLM 안전성 평가 방법과 실제 수행 예 제를 제공하였다. 특히, MLCommons의 Ailuminate 등의 공개 데이터셋을 활용하여 프라이버시 침해, 악의적 활용 등 의 위험 평가를 수행한 예제를 제시하고, JSON 포맷으로 제 공되는 평가 결과의 분석 방안을 논의하였다. 마지막으로, AI 안전성 평가의 표준화 가능성을 검토하고, AI 위험 요소의 분류, 평가 데이터셋, AI 안전 평가의 자동화 등 국제 표준화된 평가 체계 구축의 필요성을 제안한다.

목차

Abstract
I. 서론
II. 본론
1. 오픈소스 AI 위험 평가 프레임워크 개요
2. Moonshot 기반 AI 위험 평가 방법
3. AI 안전성 평가의 표준화 가능성 및 향후 방향3.1. AI
III. 결론
References

저자

  • 신성필 [ Electronics and Telecommunications Research Institute (ETRI) ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국컴퓨터통신연구회 [Open Standards and ICT Association]
  • 설립연도
    1987
  • 분야
    공학>전자/정보통신공학
  • 소개
    1. 정보통신표준화 기술 연구 및 개발 2. 국내 IT전문가 조직 및 활동지원 3. 유관 단체와의 협력을 통한 국내 표준(안) 개발 4. 정보통신표준화 사업의 기술적 정책적 지원으로 대외 경쟁력 강화에 기여

간행물

  • 간행물명
    OSIA Standards & Technology Review Journal
  • 간기
    반년간
  • pISSN
    1738-9887
  • 수록기간
    1987~2025
  • 십진분류
    KDC 530 DDC 621

이 권호 내 다른 논문 / OSIA Standards & Technology Review Journal 제38권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장