상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153075.jpg
KCI등재 학술저널

통계적 결합의 정확성 연구

A Study on Degree of Exactness of a Statistically Matched Data

  • 8

통계적 자료 결합은 동일한 모집단에서 추출된 서로 다른 표본들로부터 관찰된 자료로 구성된 두 개의 파일들이 몇 개의 변수를 공통으로 갖고 있는 반면 각 파일은 해당조사의 특수성을 반영하는 고유한 변수들을 독자적으로 가지고 있는 경우에 이러한 파일들의 자료를 결합하여 두 파일이 개별적으로 갖고 있는 고유한 변수들 간의 관계를 연구하려고 할 때 시도하는 결합이다(Rässler, 2002). 그런데 이 때 두 자료가 서로 다른 개체로부터 수집되었기 때문에 정확한 결합을 할 수가 없어서 통계적 결합을 하게 된다. 따라서 통계적 결합의 결과는 관심 변수를 모두 포함하는 재조사를 하여 얻게 되는 결과와는 차이가 있게 되어 통계적 결합 결과의 정확성을 평가해야 한다. 지금까지는 결합에 사용한 방식을 기존에 조사된 자료를 분리하여 얻은 두 개의 가상 파일들에 적용한 후 나타난 일치율의 차이를 정확도처럼 제시하였는데 이는 결합 대상 파일의 특성에 따라 절대적인 한계가 있다. 따라서 결합의 정확성에 대한 정보를 결합에 사용되는 자료로부터 추출하는 방법을 모색할 필요가 있다. 이에 본 논문은 모의자료 생성방법을 이용하여 자료로부터 결합의 정확성에 관한 정보를 얻는 방안을 모색하고 그 결과를 검토하였다.

This study focuses on the statistical matching of two different survey data files obtained from the common population with some common variables in both files whose names are a recipient file and a donor file. Many researches have been done to develop the algorithms for more precise matched results. However no one can confirm directly whether how much the matched data set is close to what would be obtained if a new survey with the variables supplying all the information needed be done in a real situation. In this paper we investigate any possibilities to get the information on the degree of exactness of the matched data from the characteristics of the files used for matching through simulation study. We find the proportion of exact matching depends on the characteristics of the files such as the coefficient of determination between the common variables and the variables of interest and also the proportion of the event of interest in the recipient file. Also the expected degree of association of the two variables of interest affect the validity of the data matched.

1. 서론

2. 연구방법

3. 일치율 분석

4. 사례적용

5. 결론

References

로딩중