This study predicted trail degradation and analyzed risk factors in Seonunsan Provincial Park using four machine learning algorithms (LR, RF, SVM, XGBoost). Based on environmental data from 158 survey points, non-linear models generally outperformed the linear LR model. Despite the limited sample size, the RF model demonstrated the most balanced performance with an F1-score of 0.652 and an AUC of 0.788. XAI analysis (SHAP and PDP) identified 'slope gradient' (7°–13°) and 'trail width' (< 2.0m) as critical thresholds for surging degradation risk. These results provide a scientific basis for designating conservation hotspots and implementing preemptive management strategies in provincial parks.
한국어
선운산도립공원 탐방로를 대상으로 기계학습 기반의 훼손 여부 예측 및 위험 요인 분석을 수행하였다. 공원 내 10개 노선 158개 측점을 대상으로 7개의 물리적 환경 특성을 조사하고, 이를 바탕으로 로지스틱 회귀(LR), 랜덤 포레스트(RF), 서포트 벡터 머신(SVM), XGBoost 등 4가지 분류 알고리즘을 적용해 예측 성능을 비교⋅분석하였다. 연구 결과, 단순 선형 기반의 LR 모델보다 비선형적 패턴 학습이 가능한 기계학습 모델이 전반적으로 우수한 예측 성능을 보였다. 비록 한정된 샘플수를 가진 연구로 특정 알고리즘의 적합성을 단정할 수는 없으나, 이 연구에서는 랜덤 포레스트(RF) 모형이 F1-score(0.652)와 AUC(0.788) 등 다각적인 지표에서 가장 균형 잡힌 예측력을 보였다. 나아가 설명 가능한 인공지능(XAI) 기법인 SHAP과 PDP 분석을 적용한 결과, 훼손에 가장 큰 영향을 미치는 물리적 환경 요인은 ‘경사도’와 ‘노폭’임을 확인되었으며, 경사도 7°~13° 구간과 노폭 2.0m 미만의 지점에서 훼손 위험이 급격히 증가하는 비선형적 임계점(threshold)을 도출하였다. 본 연구는 도립공원 탐방로 훼손 예측에 있어 기계학습의 실무적 활용 가능성을 입증하고, 선제적 예방 대책을 위한 훼손 핫스팟(hotspot) 지정의 과학적 가이드라인을 제시하였다는 데 의의가 있다.
목차
요약 Abstract 서론 재료 및 방법 연구대상지 개요 현장 조사 데이터 전처리 분석 방법 기계학습 모형의 설명 가능한 인공지능(XAI) 분석: SHAP 및 PDP 결과 및 고찰 입력 데이터 분류 탐방로 물리적 특성 기계학습 별 모델 성능 평가 및 최적 모델 선정 기계학습 결과에 따른 탐방로 훼손 영향요인 분석 결론 Conflicts of interest 인용문헌
키워드
경사도노폭랜덤 포레스트(RF)설명 가능한 인공지능(XAI)특별관리지역Slope gradientTrail widthRandom Forest (RF)Explainable AI (XAI)Hotspot