Obesity is defined as a disease by the World Health Organization and indicates internal and external influences on the body. This study aims to predict obesity according to lifestyle patterns using machine learning. The data used for machine learning used open data, and the machine learning model used Google Colab and Python. The model configuration consisted of a total of five models: Light Gradient Boosting Machine, Extreme Gradient Boosting, Decision Tree Classifier, K Neighbors Classifier, and Naive Bayes. The performance evaluation indices for each model were accuracy, area under curve, recall, precision, and F1-score. Among the five models using the data, Light Gradient Boosting Machine showed the best performance in all indices, and the results for the indices were accuracy 0.9601, area under curve 0.9981, recall 0.9601, precision 0.9611, and F1-score 0.9601. Through this study, it is believed that it will be possible to prevent obesity in advance by predicting obesity according to basic lifestyle patterns.
한국어
비만은 세계보건기구에서 질병으로 규정하고 있으며, 신체 내외부적인 영향을 나타낸다. 본 연구는 머신러닝을 이용 하여 생활패턴에 따른 비만도를 예측하고자 한다. 머신러닝에 이용한 데이터는 오픈데이터를 사용하였으며, 머신러닝 모델은 구글 코랩, 파이썬을 이용하고 모델 구성은 Light Gradient Boosting Machine, Extreme Gradient Boosting, Decision Tree Classifier, K Neighbors Classifier, Naive bayes 총 5개의 모델로 구성하였다. 각 모델 성능 평가 지표는 정확도, area under curve, 재현율, 정밀도, F1-score로 평가하였다. 해당 데이터를 활용한 5개 모델 중 Light Gradient Boosting Machine이 모든 지표에서 성능이 가장 우수 했으며, 지표에 대한 결과는 정확도 0.9601, area under curve 0.9981, 재현율 0.9601, 정밀도 0.9611, F1 score 0.9601이었다. 본 연구를 통해 기본적인 생활 패턴에 따른 비만도 예측을 통해 비만에 대한 사전 예방이 가능할 것으로 사료된다.
목차
Abstract Ⅰ. 서론 Ⅱ. 실험 재료 및 방법 1. 비만도 데이터 2. 머신러닝 모델 구성 Ⅲ. 결과 Ⅳ. 고찰 및 결론 참고문헌 요약