Earticle

현재 위치 Home

인터넷방통융합

분류 머신러닝 모델의 동치 클래스 분할 테스트의 충분성 평가
Adequacy Assessment of Equivalent Class Test in Classifier Machine Learning Model

첫 페이지 보기
  • 발행기관
    국제인공지능학회(구 한국인터넷방송통신학회) 바로가기
  • 간행물
    한국인터넷방송통신학회 논문지 KCI 등재 바로가기
  • 통권
    제24권 제5호 (2024.10)바로가기
  • 페이지
    pp.77-82
  • 저자
    윤회진
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A457392

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

원문정보

초록

영어
The test set of machine learning consists of the remaining data that did not participate as training data. It is quantitative division and it is setting aside a certain amount of data which has the same effect as random selection. However from a software testing perspective, test cases sufficient to catch errors are selected as a test set rather than a random selection. This is called the adequacy of the test case, and the higher the adequacy, the better the test case is selected. We want to examine whether the test cases used in machine learning are sufficient from this perspective by comparing them with the equivalence split method of software testing. If higher sufficiency is guaranteed when applying a software test design technique, that is, equivalence splitting, high effectiveness can be achieved with a small number of test sets. This reduces the size of the test set, thereby increasing the size of the training data set and ultimately securing more data to learn. It can be expected that more sophisticated models can be built with larger training data sets.
한국어
머신러닝의 테스트 집합은 학습 데이터로 참여하지 않은 나머지 데이터들로 이루어진다. 학습 데이터와 테스트 데이터를 나누는 기준은 양적 분할 즉 일정 양의 데이터를 떼어두는 방식을 적용하여, 랜덤 선택과 같은 효과를 나타낸 다. 그러나 소프트웨어 테스트 관점에서 보면, 랜덤 선택보다 오류를 잡아내기에 충분한 테스트 케이스들을 테스트 집합 으로 선정한다. 이를 테스트 케이스의 충분성(adequacy)이라 하며, 충분성이 높을수록 잘 선정된 테스트 케이스가 된 다. 머신러닝에서 사용되는 테스트 케이스는 이런 관점에서 충분한지를 소프트웨어 테스트의 동치분할 방식과 비교하여 살펴보고자 한다. 만일 소프트웨어 테스트 설계 기법, 즉 동치분할을 적용한 테스트 집합이 높은 충분성을 보장한다면, 적은 수의 테스트 집합으로 높은 효과를 볼 수 있다. 이는 테스트 집합의 크기를 작게하여 학습 데이터 집합의 크기가 상대적으로 커지고, 결국 학습할 데이터를 많이 확보하게 된다. 보다 큰 학습 데이터 집합으로 보다 정교한 모델을 구축 할 수 있음을 기대할 수 있다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
1. 소프트웨어 테스트 케이스 충분성
2. 머신러닝 데이터 분할
Ⅲ. 테스트 집합 충분성 평가
1. 실험 설계
2. 실험 결과
Ⅳ. 분석 및 결론
References

키워드

Equivalent class partition Machine Learning Test adequacy Random partition

저자

  • 윤회진 [ Hoijin Yoon | 정회원, 협성대학교 컴퓨터공학과 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제인공지능학회(구 한국인터넷방송통신학회) [The International Association for Artificial Intelligence]
  • 설립연도
    2000
  • 분야
    공학>전자/정보통신공학
  • 소개
    인터넷방송, 인터넷 TV , 방송 통신 네트워크 및 관련 분야에 대한 국내는 물론 국제적인 학술, 기술의 진흥발전에 공헌하고 지식 정보화 사회에 기여하고자 한다.

간행물

  • 간행물명
    한국인터넷방송통신학회 논문지 [The Journal of the Institute of Internet, Broadcasting and Communication]
  • 간기
    격월간
  • pISSN
    2289-0238
  • eISSN
    2289-0246
  • 수록기간
    2001~2025
  • 십진분류
    KDC 326 DDC 380

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제24권 제5호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장