상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

무응답 자료에 대한 EM 알고리즘을 이용한 모형 선택 방법

A Model Selection Method Using EM Algorithm for Missing Data

  • 2

본 연구는 각종 선거를 앞두고 실시되는 사전조사 자료를 이용하여 최적의 선거예측을 수행하기 위한 모형 선택방법을 다루었다. 많은 경우 사전조사 자료들은 범주형 자료이고 다차원 분할표의 형태로 정리될 수 있다. 또한 민감한 주제를 다루는 경우 대부분 무응답을 포함하고 있다. 무응답에 대한 잘못된 처리는 편향을 발생시킬 수 있으며 정확한 선거예측에 저해요인이 된다. 특히 무시할 수 없는 무응답 가정하에서 최대우도방법을 이용하게 되면 변방값 문제가 발생할 수 있고 이 또한 추정결과의 편향을 발생시킬 수 있다. 본 연구에서는 변방값 문제를 해결하기 위하여 경험적 베이지안 방법을 이용하였으며 무응답 대체를 위하여 EM알고리즘을 이용하였다. EM 알고리즘에 의한 추정에서 모형 선택을 위해 Ibrahim et al.(2008)이 제안한 방법을 이용하였다. 제안된 방법은 2004년 대한민국 국회의원 선거를 앞두고 실시된 사전조사 자료에 적용되었으며 비교적 정확한 예측을 수행하였다.

We considered a model selection method to forecast of the election result using pre election survey data. In many cases, the survey data can be summarized at multi-dimensional contingency table and include miss or non-response data. Inaccurate method of missing data can make biased results. Especially, when we used ML method under non-ignorable non-response mechanism, we may have a boundary solution problem. In this paper we introduced Bayesian method for the EM algorithm to handle the boundary solution problem. We also consider model selection criteria based on EM algorithm which Ibrahim et al. (2008) proposed. The introduced methods were applied to the pre election survey data for the 2004 Korean national assembly race and made relatively exact prediction.

1. 서론

2. 무응답을 가지고 있는 범주형 자료에 대한 분석 방법

3. 모형 구축 및 모형 비교 방법

4. 자료분석

5. 결론

참고문헌