요약
ABSTRACT
1. 서론
2. 관련 연구
2.1 기술 발전과 보안 위협 증가
2.2 지도학습을 이용한 악성 패킷 탐지
2.3 비지도학습을 이용한 악성 패킷 탐지
3. 구현
3.1 구현 환경
3.2 Train and Test split 과정
3.3 데이터 전처리
3.4 환경 - MDP(마르코프 결정 프로세스)
3.5 DQN(Deep Q-Network) 학습모델
3.6 Q-learning 학습 모델
4. 실험 및 평가
4.1 실험 결과
4.2 실험 결과 분석
5. 결론
참고문헌