상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153042.jpg
KCI등재 학술저널

결측을 포함한 반복측정자료 모형에서 결측자료 메커니즘의 영향

Missing Data Mechanism on a Model for Repeatedly Measured Data with Missing Values

  • 27

반복측정자료에서는 관측개체의 중도탈락 등의 원인으로 인하여 결측이 흔히 발생한다. 반복 측정자료를 분석하기 위하여 동일한 개체에 대한 반복측정된 다른 시점의 값들 사이의 연관성을 포함하는 모형이 적합되는데 이 모형은 결측자료 하에서 정보의 손실이 없고 결측자료 메커니즘이 MAR(Little and Rubin, 2002)을 따른다면 모수의 추정에 편향(bias)이 발생하지 않는다고 알려져 있다. 반복측정자료의 분석에는 주요 관심 대상이 되는 변수 및 공변량 만을 모형에 포함시켜 분석하는 제한적 모형(restrictive model)이 흔히 사용되는데 이는 절약모형(parsimonious model)이 해석 및 설명하기 쉽기 때문이다. 반면, Collins, Schafer, and Kam(2001)은 횡단면 분석을 위한 모형에서 반응변수 및 결측 발생과 연관된 설명변수가 포함되지 않은 제한적 모형이 결측자료에 적용된다면 모수에 편향이 발생할 수 있다는 점을 모의실험을 통해 보였다. 본 연구에서는 결측을 포함한 반복측정자료에서 반응변수 및 결측 발생과 모두 연관되어 있지만 주요 관심 대상이 되는 설명 변수와 연관되지 않아 공변량이 아닌 변수가 모형에 포함되지 않는 제한적 모형과 이 변수를 모형에 포함하는 모형에서 모수 추정에 편이가 발생하는 지를 모의실험을 통해 비교하였다. 제한적 모형의 경우 모수 추정에 편향이 발생하는 것으로 나타나 결측자료 분석에서는 결측자료 메커니즘을 고려하여 연관된 변수를 포함하는 모형이 적절하게 나타났다. 하지만 모수 추정의 편이는 동일한 개체에 대하여 반복측정된 값들 사이의 연관성이 높아짐에 따라 작아지는 것으로 나타났다.

Missing values often occur in repeatedly measured data due to dropouts and other reasons. To conduct an analysis of repeatedly measured data, models include correlations among different time points for the same subject. It is known that this model does not delete any observed values due to missingness of other time points and provides unbiased estimates of the parameters if missing data mechanism is MAR(Litte and Rubin, 2002). The analysis of repeatedly measured data often follows a restrictive approach that includes only variables of interests and covariates, since this parsimonious model is simple and easy to explain. On the other hand, a simulation study by Collins, Schafer, and Kam(2001) shows that a restrictive model could provide biased parameter estimates if it does not include an explanatory variable which is related to both a response variable and missingness. Here, we conducted a simulation study to compare this restrictive model without the explanatory variable and the model with the explanatory variable for repeatedly measured missing data. Since the restrictive model may provide biased parameter estimates, it is more appropriate to select explanatory variables by considering the missing data mechanism as well. It is also indicated that the size of biases depends on the correlation among repeated measured variables.

1. 서론

2. 반복측정자료 모형

3. 모의실험

4. 결론

참고문헌

로딩중