AI 위험/안전 평가를 위한 오픈소스 프레임워크

신성필

216.73.216.95

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

Article 4

AI 위험/안전 평가를 위한 오픈소스 프레임워크

발행기관

한국컴퓨터통신연구회 바로가기
간행물

OSIA Standards & Technology Review Journal 바로가기
통권

제38권 제1호 (2025.03)바로가기
페이지

pp.31-37
저자

신성필
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A466101

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

한국어: 최근 대규모 언어 모델(LLM, Large Language Model) 기반의 고성능 AI 모델 활용이 확산됨에 따라 편향(Bias), 유 해 콘텐츠(Toxicity), 허위 정보(Misinformation), 개인정보 보호(Privacy), 악의적 활용(Malicious Use) 등의 위험 요소 가 주요한 사회적 문제로 대두되고 있다. 이러한 위험 및 안전 성을 평가하기 위해 다양한 AI 안전성 평가 프레임워크가 개 발되고 있으며, 대표적인 오픈소스 프레임워크로 Inspect, Moonshot, Dioptra, Garak 등이 있다. 본 논문에서는 특히 LLM 모델의 위험 및 안전성 벤치 마크에 특화된 Inspect와 Moonshot을 비교 분석하고, Moonshot을 활용한 LLM 안전성 평가 방법과 실제 수행 예 제를 제공하였다. 특히, MLCommons의 Ailuminate 등의 공개 데이터셋을 활용하여 프라이버시 침해, 악의적 활용 등 의 위험 평가를 수행한 예제를 제시하고, JSON 포맷으로 제 공되는 평가 결과의 분석 방안을 논의하였다. 마지막으로, AI 안전성 평가의 표준화 가능성을 검토하고, AI 위험 요소의 분류, 평가 데이터셋, AI 안전 평가의 자동화 등 국제 표준화된 평가 체계 구축의 필요성을 제안한다.

저자

신성필 [ Electronics and Telecommunications Research Institute (ETRI) ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국컴퓨터통신연구회 [Open Standards and ICT Association]
설립연도
1987
분야
공학>전자/정보통신공학
소개
1. 정보통신표준화 기술 연구 및 개발 2. 국내 IT전문가 조직 및 활동지원 3. 유관 단체와의 협력을 통한 국내 표준(안) 개발 4. 정보통신표준화 사업의 기술적 정책적 지원으로 대외 경쟁력 강화에 기여

간행물

간행물명

OSIA Standards & Technology Review Journal
간기
반년간
pISSN
1738-9887
수록기간
1987~2026
십진분류
KDC 530 DDC 621

이 권호 내 다른 논문 / OSIA Standards & Technology Review Journal 제38권 제1호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

AI 위험/안전 평가를 위한 오픈소스 프레임워크

원문정보

초록

목차

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / OSIA Standards & Technology Review Journal 제38권 제1호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.