Earticle

현재 위치 Home

불균형 데이터 처리를 통한 침입탐지 성능향상에 관한 연구
A study on intrusion detection performance improvement through imbalanced data processing

첫 페이지 보기
  • 발행기관
    한국융합보안학회 바로가기
  • 간행물
    융합보안논문지 KCI 등재 바로가기
  • 통권
    제21권 제3호 (2021.09)바로가기
  • 페이지
    pp.57-66
  • 저자
    정일옥, 지재원, 이규환, 김묘정
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A400764

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
As the detection performance using deep learning and machine learning of the intrusion detection field has been verified, the cases of using it are increasing day by day. However, it is difficult to collect the data required for learning, and it is difficult to apply the machine learning performance to reality due to the imbalance of the collected data. Therefore, in this paper, A mixed sampling technique using t-SNE visualization for imbalanced data processing is proposed as a solution to this problem. To do this, separate fields according to characteristics for intrusion detection events, including payload. Extracts TF-IDF-based features for separated fields. After applying the mixed sampling technique based on the extracted features, a data set optimized for intrusion detection with imbalanced data is obtained through data visualization using t-SNE. Nine sampling techniques were applied through the open intrusion detection dataset CSIC2012, and it was verified that the proposed sampling technique improves detection performance through F-score and G-mean evaluation indicators.
한국어
침입탐지 분야에서 딥러닝과 머신러닝을 이용한 탐지성능이 검증되면서 이를 활용한 사례가 나날이 증가하고 있다. 하지만, 학습에 필요한 데이터 수집이 어렵고, 수집된 데이터의 불균형으로 인해 머신러닝 성능이 현실에 적용되는데 어려움이 있다. 본 논문에서는 이에 대한 해결책으로 불균형 데이터 처리를 위해 t-SNE 시각화를 이용한 혼합샘플링 기법을 제안한다. 이를 위해 먼저, 페이로드를 포함한 침입탐지 이벤트에 대해서 특성에 맞게 필드를 분리한다. 분리된 필드에 대해 TF-IDF 기반의 피처를 추출한다. 추출된 피처를 기반으로 혼합샘플링 기법을 적용 후 t-SNE를 이용한 데이터 시각화를 통해 불균형 데이터가 처리된 침입탐지에최적화된데이터셋을얻게된다. 공개침입탐지데이터셋CSIC2012를통해9가지샘플링기법을적용하였으며, 제안 한 샘플링 기법이 F-score, G-mean 평가 지표를 통해 탐지성능이 향상됨을 검증하였다.

목차

요약
ABSTRACT
1. 서론
2. 관련 연구
3. 샘플링 기법을 통한 불균형 학습 데이터 처리
3.1 제안된 접근법
3.2 불균형 데이터에 대한 샘플링 기법
4. 실험 및 평가
4.1 데이터셋
4.2 데이터 전처리
4.3 평가 방법
4.4 실험 결과
5. 결론
참고문헌

키워드

imbalanced data intrusion detection machine learning sampling

저자

  • 정일옥 [ Jung Il Ok | 고려대학교/정보보호학과 ] 주저자
  • 지재원 [ Jae-Won Ji | 이글루시큐리티 ] 공동저자
  • 이규환 [ Gyu-Hwan Lee | 이글루시큐리티 ] 공동저자
  • 김묘정 [ Myo-Jeong Kim | 이글루시큐리티 ] 공동저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국융합보안학회 [Korea Information Assurance Society]
  • 설립연도
    2001
  • 분야
    공학>전자/정보통신공학
  • 소개
    본 학회는 사이버테러 및 정보전에 관한 학문연구ㆍ기술 개발ㆍ기반 구축을 도모하고 국내ㆍ외 관계기관과 학술교류와 정보교환을 통하여 회원 상호간의 전문지식을 배양하고, 궁극적으로는 국가 중요 정보기반구조를 보호함을 그 목적으로 한다.

간행물

  • 간행물명
    융합보안논문지 [Jouranl of Information and Security]
  • 간기
    연5회
  • pISSN
    1598-7329
  • 수록기간
    2001~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 005 DDC 005

이 권호 내 다른 논문 / 융합보안논문지 제21권 제3호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장