공변량 보정 베이지안 합동 모형을 활용한 지역별 우울증 유병률 추정
Estimating the Prevalence of Depression by Area Using a Bayesian Pooled Model with Covariate Correction
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.26 No.6
-
2024.121881 - 1893 (13 pages)
-
DOI : 10.37727/jkdas.2024.26.6.1881
- 13

전국 단위의 대규모 조사의 경우에도 읍면동 단위의 소지역 추정에서 표본의 수에 대한 부족문제가 발생할 수 있으며, 이때, 계층적 베이지안 합동 모형을 활용하여 주변의 유사한 지역에 대한 정보를 빌려줌으로써 추정값의 신뢰도를 향상시킬 수 있다. 계층적 베이지안 합동 모형의 경우 정의된 사전분포의 초모수를 통해 지역간 정보를 직접 또는 간접적으로 공유하며 부족한 표본 정보를 보강할 수 있는 반면, 정보를 공유하는 과정에서 과대 축소 추정 문제(over-shrinkage problem)가 발생할 수 있다. 과대 축소 추정 문제란 지역간 정보를 공유하는 과정에서 지역 특이적으로 가질 수 있는 오차들의 상쇄를 통해 모든 지역에서 전국 평균 발생 비율에 유사한 추정값이 산출되는 것을 의미하며 지역간 유사성이 낮은 경우 과대 축소 추정의 문제는 지역 추정값의 편의를 증가시키는 요인으로 작용할 수 있다. 본 연구에서는 지역간 정보를 공유하는 역할의 초모수에 대해 지역 특성 공변량과의 일반화 선형 회귀 모형의 구조를 포함시켜 지역의 특성 공변량에 따른 변동을 고려하는 동시에 절편항을 통해 지역 정보 공유할 수 있는 구조적 모형을 구축하고 신뢰성 있는 소지역 추정값을 산출하는 것을 목표로 한다. 한편, 구축된 계층적 베이지안 회귀 모형을 통해 우리나라 읍면동의 우울증 유병률을 추정하고, 지역간 편차가 나타나는 원인 특성 공변량을 확인하고 고찰하였다.
In spite of nationwide large-scale surveys, sample size issues may arise when estimating for small areas such as towns. In these cases, hierarchical Bayesian pooling models can enhance the reliability of estimates by borrowing information from similar surrounding areas. Hierarchical Bayesian pooling models can share information between areas either directly or indirectly through hyperparameters defined in the prior distribution, thereby reinforcing limited sample information. However, an over-shrinkage problem can arise during the information-sharing process. This study aims to establish a structural model incorporating a generalized linear regression model with regional characteristic covariates for the hyperparameters responsible for sharing information between areas. This approach accounts for variations according to regional characteristic covariates while facilitating the sharing of regional information through intercept terms, thereby producing reliable small area estimates. Meanwhile, using the established hierarchical Bayesian regression model, we estimated the prevalence of depression in small areas, and identified and examined the covariates responsible for regional variations.
1. 서론
2. 계층적 베이지안 합동 모형
3. 자료분석
4. 결론
Reference
(0)
(0)