창업기업 생존 예측을 위한 인공지능 모델의 변수 체계 검증 : 창업실태조사 기반 시뮬레이션 분석
A Simulation-Based Validation of Variable Frameworks for AI Models Predicting Startup Survival Using Startup Survey Data
This study aims to develop an artificial intelligence model for predicting the survival of startup companies and to validate the variable framework derived from the national Startup Survey through simulation-based analysis. A total of 50 variables were constructed across five domains—founder characteristics, general business features, entrepreneurial execution, managerial performance, and technological innovation. Using conditional probability-based statistical rules, a synthetic dataset of 2,000 startup cases was generated. XGBoost and Random Forest algorithms were employed as prediction models, with Synthetic Minority Over-sampling Technique (SMOTE) applied to address data imbalance, and RandomizedSearchCV used for hyperparameter optimization. As a result, the Random Forest model achieved the best performance, with an AUC of 0.704, Recall of 0.897, and F1 Score of 0.733. Feature importance analysis revealed that variables such as technology development, funding type, employment size, education level, and previous occupation had consistently high predictive power. The findings demonstrate the practical utility of a simulation-based approach to validate variable frameworks in the absence of microdata, and offer a methodological basis for policy design and early warning systems in startup support and risk management.
한국어
본 연구는 창업기업의 생존 여부를 예측하기 위한 인공지능 모델을 개발하고, 창업실태조사 기반 변수 체계의 타당성을 시뮬레이션 분석을 통해 검증하였다. 창업자 특성, 기업 일반 특성, 창업 실행, 경영성과, 기술혁신 등 5개 영역에서 총 50개 변수를 설계하고, 조건부 확률 및 통계 규칙에 기반한 시뮬레이션 데이터를 2,000개 생성하였다. 예측 모델로는 XGBoost와 Random Forest를 적용하였으며, 데이터 불균형 해소를 위해 SMOTE, 성능 향상을 위해 RandomizedSearchCV를 활용하였다. 그 결과, Random Forest 모델이 AUC 0.704, Recall 0.897, F1 Score 0.733으 로 가장 우수한 성능을 보였다. 변수 중요도 분석에서는 기술개발 수행 여부, 자금 조달 방식, 고용 규모, 학력 수준, 직전 직업군 등이 공통적으로 높은 예측 기여도를 나타냈다. 본 연구는 실제 마이크로데이터 없이도 변수 체계의 예 측력을 검증할 수 있는 시뮬레이션 기반 접근법의 실용성을 입증하였으며, 창업정책 설계 및 조기경보 시스템 개발을 위한 기초 자료로 활용될 수 있다.
목차
요 약 Abstract Ⅰ. 서론 Ⅱ. 변수 설계 및 데이터 구축 2.1 변수 설계 기준 및 선정 절차 2.2 변수 정제 및 구조화 2.3 시뮬레이션 데이터셋 생성 절차 2.4 시뮬레이션 데이터셋의 구성 검증 및 통계적 분석 Ⅲ. AI 기반 생존 예측 모델 학습 및 변수 분석 3.1 모델 구성 및 학습 방법 3.2 예측 성능 결과 및 비교 3.3 변수 중요도 분석 Ⅳ. 결론 및 제언 References
국제문화기술진흥원 [The International Promotion Agency of Culture Technology]
설립연도
2009
분야
공학>공학일반
소개
본 진흥원은 문화기술(Culture Technology) 관련 산·학·연·관으로 구성된 비영리 단체이다. 문화기술(CT)은 정보통신기술(ICT), 문화적 사고 기반의 예술, 인문학, 디자인, 사회과학기술이 접목된 신융합기술(New Convergence Technology, NCT)로 정의한다. 인간의 삶의 질을 향상시키고, 진보된 방향으로 변화시키고, 문화기술 관련 분야의 학술 및 기술의 발전과 진흥에 공헌하기 위하여, 제3조의 필요한 사업을 행함을 그 목적으로 한다.
간행물
간행물명
The Journal of the Convergence on Culture Technology (JCCT) [문화기술의 융합]
간기
격월간
pISSN
2384-0358
eISSN
2384-0366
수록기간
2015~2025
등재여부
KCI 등재
십진분류
KDC 600DDC 700
이 권호 내 다른 논문 / The Journal of the Convergence on Culture Technology (JCCT) Vol.11 No.5