로그모형과 일반화선형모형의 예측성능 비교 : 횡단면자료의 개인지출의료비 예측 사례를 중심으로
A Comparative Study on the Prediction Performance of a Log model and Generalized linear models - Focused on the prediction of personal medical expenditure using cross sectional data
The purpose of this study is to compare the predictive performance of the log model with that of the generalized linear models(GLM), when estimating the individual medical expenses in cross-sectional data. As a result of the analysis, the bias existed in the prediction by homoskedastic retransformation of log model and the prediction performance for the rest model was not statistically different from each other. When the log scale error term of log model is heteroskedastic, the homoskedastic retransformation of the log model can be biased. This study suggests using generalized linear models rather than the log model.
한국어
본 연구는 횡단면 자료의 개인지출의료비 예측에서 로그모형과 일반화선형모형의 예측성과를 비교할 것을 목적으로 한다. 한국의료패널 등의 서베이 자료를 사용하는 연구에서는 연속형 종속변수의 왜도를 교정하기 위해 변수를 로그변환을 한 후 선형회귀모형 등의 선형함수를 사용하는 경향이 있다. 이러한 배경 하에 본 연구는 개인지출의료비의 예측과 관련하여 선형함수에 기반을 둔 로그모형과 일반화선형모형의 사용에 초점을 두었다. 예측성과의 비교를 위해 로그모형의 등분산 변환과 이분산 변환 그리고 일반화선형모형의 포아송회귀모형과 감마회귀모형을 대상으로 교차검증을 실시하였다. 분석 결과, 로그모형의 등분산 변환에 의한 예측에서 편의가 존재하였고 나머지 모형의 예측성과는 통계적으로 유의한 차이가 없었다. 따라서 본 연구는 로그척도 오차항이 이분산적일 때 로그모형의 등분산 변환보다는 일반화선형모형이 더 나은 결과를 제공함을 보여준다.
목차
초록 I. 서론 II. 이론족 배경 2.1 로그모형 2.2 일반화선형 모형 III. 연구방법 3.1 자료 3.2 변수 3.3 모형의 추정 3.4 예측성과의 비교 IV. 결과 4.1 요약통계량 4.2 추정결과 4.3 교차검증 결과 V. 결론 부록 참고문헌 Abstract
키워드
의료비왜도로그모형일반화선형모형EEE한국의료패널medical expenditureskewnesslog modelgeneralized linear model(GLM)Extended Estimating Equations(EEE)Korea Health Panel(KHP)
기존의 경제학회들은 과도하게 이론에 치중하여 현실 경제를 도외시 하는 경향이 심하였다.
이에 경제학의 모든 분야에 걸쳐, 노동경제, 환경경제, 통일경제, 산업조직, 국제경제학, 금융경제학 등 모든 분야에서 이론적인 학문을 위한 학문보다는 현실적인 문제에 접근하고자 한국 응용경제학회가 창립되었다.
따라서 논문 발표시에 가급적 대학원 학생들이 쉽게 이해할 수 있는 수준으로, 국가 정책 수립에 도움이 되는 논문 발표를 권장한다. 아울러 젊은 교수들에게 폭넓은 연구기회를 부여하기 위하여, 일년에 한번씩 최우수 논문에 약간의 연구비를 지급한다.