성인 비만율의 지역간 변이 요인 분석: 의사결정나무를 이용하여

Analysis of Factors associated with Geographic Variations in the Prevalence of Adult Obesity using Decision Tree

본 연구의 목적은 지역간 비만율의 변이를 결정짓는 건강행태, 동반질환특성, 사회경제특성 요인을 밝히는 것이다. 2009-2011년 지역사회건강조사와 인구주택총조사, 지역별의료이용통계, 국토해양부 통계의 지역별 지표로 데이터세트를 구축하였으며, 지역별 비만율에 영향을 미치는 공통 요인과 지역 특이적 요인을 확인하기 위해 데이터마이닝의 회귀분석과 의사결정나무를 이용하였다. 단계적 다중회귀분석 결과 모형의 설명력은 31.9%였으며, 고위험음주율이 높을수록(b=0.19874), 우울감경험률이 높을수록(b=0.25847), 현재흡연율이 높을수록(b=0.255), 고혈압 평생 의사진단 경험률이 높을수록 (b=0.13004), 당뇨치료율이 높은 지역일수록(b=0.06053) 비만율이 높은 반면, 걷기실천율이 낮은 지역일수록(b=-0.03634) 비만율이 높았다. 의사결정나무에서는 고위험음주율, 현재흡연율, 우울감경험률, 걷기실천율 외에 고혈압 치료 및 관리교육, 당뇨병 진단 및 치료율, 학력, 유배우자비율이 주요 변이요인으로 나타났다. 지역 간 비만율의 변이 요인 중 음주, 흡연, 운동, 정신건강 등 건강행태가 중요하게 영향을 미쳤으며, 동반질환과 사회경제적 요인에 따라 총 21개의 지역 비만 변이 유형이 나타났다. 이를 기반으로 지역 특성에 맞는 비만 관리 사업을 개발할 필요가 있다.

This study examines how health behavior types, comorbid diseases and socioeconomic factors affect the prevalence of adult obesity. To analyze, we first construct a rich and combined data set including Annual Community Health Survey, a Census on Population and Housing, Regional Statistics on Medical Use, and various socioeconomic regional attributes at the level of 247 small administrative district in South Korea in the period from 2009-2011. We then use empirical methods (regression analysis and decision tree analysis) of estimating common- and region-specific factors that would give an influence on the adult obesity rate. Our results from the stepwise regression model suggest that the adult obesity rate is positively correlated with high-risk drinking rate, the ratio of depression, current smoking rate, hypertension prevalence, diabetes cure rate and low walking practice rate, as we anticipated. Also, our results from the decision tree model support our findings from the regression analysis, and they suggest that additional variables, such as diabetes diagnosis and cure rates, the education level and the ratio of marital status, may also be significant attributes that are associated with the prevalence of adult obesity. As a result, our study classifies 21 different types of geographic variations of the adult obesity, on the basis of important health-related and socioeconomic factors. Our study may shed light on which attributes are more closely related to the obesity rate and, indeed, suggest that there would be sufficient variations across regions, at least in our sample. Thus, in order to decrease the obesity problems, our study emphasizes the necessity to implement customized health policies according to the region-specific characteristics.

