Traffic accidents occur in Korea are calculated with the 「Automobile Accident Negligence Ratio Certification Standard」 prepared by the ‘General Insurance Association of Korea’ and the insurance company's agreement or judgment is made. However, disputes are frequently occurring in calculating the negligence ratio. Therefore, it is thought that a more effective response would be possible if accident type according to the standard could be quickly identified using traffic accident information prepared by police. Therefore, this study aims to develop a model that learns the accident information prepared by the police and classifies it to match the accident type in the standard. In particular, through data mining, keywords necessary to classify the accident types of the standard were extracted from the accident data of the police. Then, models were developed to derive the types of accidents by learning the extracted keywords through decision trees and random forest models.
한국어
국내에서 발생하는 교통사고는 손해보험협회에서 작성한 「자동차사고 과실비율 인정기준」 에 따라 과실비율을 산정하며, 이를 통해 보험사의 합의나 판결이 내려진다. 하지만, 과실비율 산정에 있어 분쟁이 빈번하게 일어나고 있다. 따라서, 교통사고 발생 시 경찰공무원에 의해 작 성되는 교통사고 정보를 이용하여 「자동차사고 과실비율 인정기준」상의 교통사고 유형을 신 속하게 확인할 수 있다면, 보다 효과적인 대응이 가능할 것으로 사료된다. 이에 본 연구에서는 경찰에 의해 작성된 교통사고 정보를 학습시켜 「자동차사고 과실비율 인정기준」에서 제시하 는 교통사고 유형으로 분류하는 모델을 개발하고자 한다. 특히, 데이터마이닝을 통해 경찰청 교통사고 데이터에서 「자동차사고 과실비율 인정기준」의 교통사고 유형으로 분류하는 데 필 요한 핵심어들을 추출하였다. 그리고, 키워드를 의사결정나무 및 랜덤 포레스트 모델을 통해 학습시켜 교통사고 유형을 도출하는 모델을 개발하였다.
목차
요약 ABSTRACT Ⅰ. 서론 1. 연구의 배경 및 목적 2. 연구의 범위 및 연구절차 Ⅱ. 관련 이론 및 연구 고찰 1. 관련 이론 고찰 2. 선행연구 고찰 3. 연구의 차별성 도출 Ⅲ. 관련 기준 및 데이터 분석과 전처리 1. 관련 기준 및 수집 데이터 검토 2. 경찰청 교통사고 데이터 전처리 Ⅳ. 의사결정나무 및 랜덤 포레스트 모델 개발 및 평가 1. 과실비율 산정 모델 개발 Ⅴ. 결론 및 향후 연구과제 REFERENCES