Comparison of Machine Learning Models for Predicting Dyslipidemia in Korean Postmenopausal Women - Analysis Using the 1st Year Data of the 9th Korea National Health and Nutrition Examination Survey -
한국 폐경 여성의 이상지질혈증 예측을 위한 머신러닝 모델 비교 - 국민건강영양조사 제 9기 1차년도 자료를 활용하여 -
This study compared machine learning models for predicting dyslipidemia in postmenopausal women using data from the first yaer of the 9th Korea National Health and Nutrition Examination Survey. A total of 1,115 postmenopausal women were analyzed after excluding missing values. Participant characteristics were analyzed using SPSS 25.0, while machine learning analysis was conducted with the Orange 3.35 program, applying logistic regression, random forest, and gradient boosting models. Among the participants, 54 percent had dyslipidemia. The random forest model demonstrated the highest performance, achieving a precision of 0.85 and a recall of 0.82, while the gradient boosting model had the highest AUC of 0.89, indicating strong classification capability. Key predictive factors included occupation, age, obesity, family history of chronic diseases, and breastfeeding history. This study suggests that random forest and gradient boosting models can effectively predict dyslipidemia in postmenopausal women, providing essential data for addressing health concerns in this population.
한국어
본 연구는 폐경 여성의 이상지질혈증 예측을 위한 머신러닝 모델을 비교하는 것을 목적으로 수행하였다. 국민건강영양조사 제9기 1차 자료를 활용하였으며, 결측 값을 제외한 폐경 여성 1,115명의 데이터를 분석하였다. 이상지질혈증은 고콜레스테롤혈증 또는 고중성지방혈증 중 하나에 해당하는 경우로 정의하 였다. 대상자의 특성은 IBM SPSS 25.0을 이용해 기술통계 및 교차분석으로 수행하였으며, 머신러닝 분석은 Orange 3.35 프로그램을 활용하여 로지스틱 회귀분석, 랜덤 포레스트, 그래디언트 부스팅 모델을 적용하였다. 연구 결과 대상자의 54%가 이상지질혈증을 보유하였으며, 랜덤 포레스트 모델이 정밀도 0.85, 재현율 0.82 으로 가장 우수한 성능을 보였다. 그래디언트 부스팅 모델은 AUC 0.89로 이상지질혈증 유무를 효과적으로 구분하는 모델임을 확인하였다. 주요 예측 요인은 직업, 나이, 비만, 만성질환 가족력, 모유수유 경험 등이었다. 본 연구는 랜덤 포레스트 모델과 그래디언트 부스팅 모델이 폐경 여성의 이상지 질혈증을 예측하는 데 유용한 도구가 될 수 있음을 제언하며, 폐경 여성 건강문제 해결을 위한 기초자료로 의미가 있다.
목차
Abstract Ⅰ. 서론 1. 연구의 필요성 2. 연구의 목적 Ⅱ. 연구방법 1. 연구설계 2. 자료 수집 및 윤리적 고려 3. 연구 대상 및 데이터 셋 4. 자료 분석 Ⅲ. 연구결과 1. 대상자의 사회경제적 특성과 이상지질혈증 2. 대상자의 건강상태 및 생활습관 특성과 이상지질혈증 3. 대상자의 여성건강 관련 특성과 이상지질혈증 4. 머신러닝 모델 비교 Ⅳ. 논의 Ⅴ. 결론 및 제언 Acknowledgement Reference 국문초록
키워드
폐경 여성이상지질혈증머신러닝예측 모델postmenopausal womendyslipidemiamachine learningpredictive model
저자
Mi-Eun Kim [ Department of Nuring Science, Jeonju University ]
The 1st author
Myoung-Lyun Heo [ Department of Nuring Science, Jeonju University ]
Corresponding Author
위기관리 이론과 실천 [Crisis and Emergency Management: Theory and Praxis]
설립연도
2005
분야
사회과학>행정학
소개
위기관리 이론과 실천(Crisis and Emergency Management: Theory and Praxis; CEM-TP)은 위기관리에 관한 제 학문분야간 협동적 연구 공동체(Research Network)로서 전통적 안보 위기, 재난 위기(자연재난, 인위재난), 국가핵심기반 위기 등에 관한 제학문적 연구를 촉진하고 제 학문분야 연구자간 협력의 토대를 구축하기 위하여 위기관리 이론과 실천 편집위원회 구성이 완료된 2005년 2월 14일에 설립되었다.
현재 위기관리 이론과 실천(CEM-TP)에 참여하고 있는 연구자들의 학문 분야는 행정학, 사회학, 정치외교학, 신문방송학, 사회복지학, 법학, 심리학, 정보학, 지리학, 경찰행정학, 소방행정학, 경호학, 토목공학, 건축학, 의학, 간호학, 보건학, 기상학, 안전공학, 전산학, 지역개발학 등이 있으며, 따라서 한국의 위기관리 연구를 가장 폭 넓게 반영하고 있는 연구 공동체라 할 수 있다.
위기관리 이론과 실천(CEM-TP)의 조직으로는 편집위원회가 있으며, 편집위원회가 본 연구 공동체를 대표하고 있다. 따라서 위기관리 이론과 실천의 각종 연구 및 출판 활동은 편집위원회가 맡고 있으며, 현재 편집위원회는 46명의 위원으로 구성되어 있다. 또한 편집위원회는 위기관리의 제학문적 연구를 촉진하고 연구자간 협력을 위한 학술지로 <한국위기관리논집>을 발행한다.
위기관리 이론과 실천(CEM-TP)의 회원은 개인회원과 기관회원으로 구분된다. 개인회원은 본 회의 설립 목적과 취지에 찬동하는 위기관리 연구자 및 실무자로 구성되고, 기관회원은 위기관리 연구 및 실무에 관련된 정부기관, 연구기관, 대학도서관 등으로 구성된다