The 4th industrial revolution and the rapid change in the data environment revealed technical limitations in the existing relational database(RDB). As a new analysis method for unstructured data in all fields such as IDC/finance/insurance, interest in graph database(GDB) technology is increasing. The graph database is an efficient technique for expressing interlocked data and analyzing associations in a wide range of networks. This study extended the existing RDB to the GDB model and applied machine learning algorithms (pattern recognition, clustering, path distance, core extraction) to detect new abnormal signs. As a result of the performance analysis, it was confirmed that the performance of abnormal behavior(about 180 times or more) was greatly improved, and that it was possible to extract an abnormal symptom pattern after 5 steps that could not be analyzed by RDB.
한국어
4차 산업 혁명과 데이터 환경의 급격한 변화는 기존 관계형 데이터베이스(RDB)는 기술적 한계를 드러내 고 있다. IDC/금융/보험 등 전 분야에서 비정형 데이터에 대한 새로운 분석방안으로 그래프 데이터베이스(GDB) 기술에 관심이 높아지고 있다. 그래프 데이터베이스는 상호 연동된 데이터를 표현하고 광범위한 네트워크에서 연관 관계 분석에 효율적인 기술이다. 본 연구는 기존 RDB를 GDB 모델로 확장하고, 새로운 이상징후 탐지를 위해 기계학습 알고리즘(패턴인식, 클러스터링, 경로거리, 핵심추출)을 적용하였다. 성능분석 결과 이상 행위 성능 (약 180배 이상)이 크게 향상되었고, RDB로 분석 불가능한 5단계 이후 이상징후 패턴을 추출할 수 있음을 확인 하였다.
목차
요약 Abstract 1. 서론 2. 관련 연구 2.1 그래프 데이터베이스 2.2 변화하는 사이버위협과 RDB의 한계 3. GDB 기반 이상징후 탐지 3.1 이상징후 탐지/분석 시스템 구조 3.2 내부 스키마와 GDB 구조 3.3 GDB 기반 이상징후 탐지 방법 4. GDB 기반 모델 검증 4.1 순위 분석 4.2 패턴 탐지 4.3 클러스터링 및 군집화 분석 4.4 경로 및 핵심추출 4.5 GDB 테이블 성능 및 비교 분석 5. 결론 REFERENCES