정형 및 비정형 데이터 결합을 활용한 자율주행차 사고 위험도 예측 모델 분석
An Analysis of Autonomous Vehicle Crash Risk Prediction Models Using Structured and Unstructured Data Fusion
This study developed an analytical framework for predicting the crash risk using autonomousvehicle crash data by examining the roles of structured data and unstructured crash descriptions in explaining the crash risk. Structured data representing crash environments, roadway conditions, and vehicle states were first analyzed to identify the structural characteristics associated with the crash risk. In addition, unstructured crash descriptions were examined to capture contextual information describing crash scenarios and crash progression. Based on these analyses, the characteristics and limitations of each data type in explaining the crash risk were reviewed. A combined prediction framework integrating information derived from structured and unstructured data was then constructed, and the performance of the combined model was evaluated using regression-based metrics. These results showed that the combined model explains a substantial portion of the crash risk variability and provides more stable risk estimates than analyses relying on a single data type. These findings highlight the importance of integrating heterogeneous data sources for crash risk prediction and demonstrate the applicability of a structured–unstructured data fusion approach in autonomous vehicle crash analysis.
한국어
본 연구는 자율주행차 사고 데이터를 활용하여 사고 위험 예측을 위한 분석 구조를 구성하 고, 정형 데이터와 비정형 사고 설명문이 사고 위험 설명에 기여하는 역할을 단계적으로 검토 하였다. 먼저 사고 발생 환경, 도로 및 차량 상태와 같은 정형 데이터를 기반으로 사고 위험과 관련된 구조적 특성을 분석하고, 사고 발생 과정이 서술된 비정형 사고 설명문을 통해 사고 상황의 맥락적 특성을 정리하였다. 이를 통해 각 데이터 유형이 사고 위험을 설명하는 데 제공 하는 정보의 성격과 한계를 비교하였다. 이후 정형·비정형 데이터에서 도출된 정보를 결합한 예측 구조를 구성하고, 회귀 기반 성능 지표를 활용하여 결합 모델의 사고 위험 예측 결과를 분석하였다. 분석 결과, 결합 모델은 사고 위험 분산의 상당 부분을 설명하며, 단일 데이터 기 반 분석에서 포착하기 어려운 사고 위험 특성을 보다 안정적으로 반영하는 경향을 보였다. 본 연구는 자율주행차 사고 위험 분석에서 정형·비정형 데이터의 역할을 구분하여 정리하고, 이 를 결합한 예측 구조의 적용 가능성을 제시하였다는 점에서 의의를 가진다.
목차
요약 ABSTRACT Ⅰ. 서론 Ⅱ. 선행연구 1. 정형 데이터 기반 자율주행차 사고 분석 연구 2. 비정형 데이터 기반 자율주행차 사고 분석 연구 3. 시사점 Ⅲ. 방법론 1. 데이터 구성 및 전처리 2. 사고 위험 예측 모델 구성 3. 사고 위험 기준 설정 4. 모델 학습 및 평가 Ⅳ. 분석결과 1. 정형 데이터 기반 사고 위험 설명 특성 2. 비정형 데이터 기반 사고 위험 설명 특성 3. 정형·비정형 데이터 결합 모델의 사고 위험 예측 결과 Ⅴ. 결론 ACKNOWLEDGEMENTS REFERENCES
키워드
자율주행차 사고사고 위험 예측정형 데이터비정형 데이터데이터 결합 모델Autonomous vehicle crashesCrash risk predictionStructured dataUnstructured dataData fusion model