본 연구는 광역시와 광역도 간의 개인적 요인과 건강수준 정도가 우울경험 여부에 영향을 미치는 변수의 중요도를 파악하고자 시도되었다. 본 연구의 자료는 질병관리청의 2021년 지역사회건강조사 데이터를 활용하였다. 광역시의 데이터는 4,602건을 이용하였고, 광역도는 19,545건의 데이터를 이용하였다. 자료 분석에 활용된 빅데이터는 R 4.3.0 for Windows를 활용하여 빈도 분석, T-test, 분산분석과 machine learning기법인 Random Forest분석을 실시하였다. 연구결과, train데이터와 test 데이터의 과적합(overfitting)의 문제는 발생하지 않았으며, machine learning 기법의 분류모델은 약 94% 수준으로 나타났다. 분석 결과 광역시와 광역도 간의 우울경험 여부에 미치는 중요도가 각각 다르게 나타났다. 두 지역의 시민에게 미치는 우울경험의 원인을 다르게 접근함으로써 보다 더 효율적인 정책수립이 가능 할 것으로 판단된다.
This study attempted to determine the importance of variables that affect whether personal factors and health levels between metropolitan cities and provinces experience depression. The data for this study was used from the Korea Disease Control and Prevention Agency's 2021 Community Health Survey. 4,602 data from metropolitan cities were used, and 19,545 data from metropolitan provinces were used. The big data used in data analysis was subjected to frequency analysis, T-test, variance analysis, and Random Forest analysis, a machine learning technique, using R 4.3.0 for Windows. As a result of the study, there was no problem of overfitting between train and test data, and the classification model of the machine learning technique was found to be at about 94%. As a result of the analysis, the importance of experiencing depression was different between large cities and local cities. It is believed that more efficient policy establishment will be possible by approaching the causes of depression experienced by citizens in the two regions differently.
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법
Ⅳ. 연구 결과
Ⅴ. 논의 및 결론
참고문헌
(0)
(0)