
암등록 자료에 대한 부산지역 소지역 분석
A Small-area Data Analysis for Cancer Registration Data of Busan
- 김아름(Ahreum Kim) 김창훈(Chang Hoon Kim) 노맹석(Maengseok Noh)
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.23 No.4
- 등재여부 : KCI등재
- 2021.08
- 1559 - 1567 (9 pages)
소지역 추정은 표본 크기가 작은 소지역이나 성별, 연령 등과 같은 변수의 특성으로 분류된 영역에 대한 통계치를 산출할 경우 표본의 수가 적어 정확한 추정이 힘들 때 이용되는 통계적 추정 방법의 하나다. 소지역 추정은 다양한 통계적인 생산에 필수적이며, 다양한 방법으로 연구되어왔다. 소지역추정방법 중 하나인 모형기반 추정 방법은 회귀분석, 공간분석 등과 같이 방법들을 고려할 수 있다. 본 연구에서는 소지역 추정을 위해서 변량효과를 고려한 다단계 일반화 선형모형을 적용하였다. 이때. 변량효과에 대한 모형가정을 정규분포, 감마분포 등 다양한 분포를 적용하였으며, 모형선택 방법을 통해서 자료에 가장 적합한 모형을 선택하였다. 분석 결과를 활용하여 행정동 단위의 소지역을 분류하는 방법을 먼저 보여주고 지역간 모형 적합 결과를 비교하고자 한다. 이를 위해 수집된 부산지역 암등록 자료 236,277건에 대해 행정동 분류를 완료했으며, 이 자료 중 위암인 경우를 선택하여 성별, 병기별로 다단계 일반화 선형모형에 적합하였다. 또한, 변량효과의 분포 및 박탈지수의 여부에 따라 적합도가 달라졌으며 박탈지수가 지역내변동을 설명할 수 있다는 것을 확인하였다. 모형 적합 결과 추정된 변량효과 추정치는 소지역간 변이를 나타내는 지표로 활용될 수 있을 것으로 기대된다.
Small area estimation is one of the statistical estimation methods when accurate estimation is difficult due to the small number of samples with a small sample size. Small area estimation are necessary for various statistical production and have been studied in various ways. A model-based estimation method, one of the small area estimation methods, is based on parametric models like regression estimation, spatial estimation and so on. In this study, hierarchical generalized linear model with random effect was applied to major cancers like stomach cancer using two types of distribution of random effect in models, respectively. For distribution of random effect, Gaussain or gamma distributions are assumed. For this purpose, the method of classifying the data into small areas of the administrative unit was presented first, and then the results of the model fitting were compared by region. We expect that the estimated random effect from the fitted model can be used as an indicator of small area variability.
1. 서론
2. 연구방법
3. 연구결과
4. 결론
References