최근 검색어 전체 삭제
KCI등재 학술저널

패널형 사업체 자료에 선택적 에디팅 적용 연구

A Study on Selective Editing for Panel Data of Business

  • 7

본 연구에서는 사업체 자료에서 선택적 에디팅을 실시할 때 발생할 수 있는 현실적인 문제를 사업체패널조사(workplace panel survey) 자료를 이용하여 선택적 에디팅 방안을 제시하였다. 대부분의 사업체 자료는 패널형태의 특성을 보임에 따라 신생 사업체의 선택적 에디팅(selective editing)을 수행할 경우, 항목점수(item score)를 산출할 때 통상 사용하는 과거 값을 사용할 수 없는 문제가 발생한다. 이에 기존에는 대체 방법을 통해 예상 값을 결정하고 항목점수를 산출하는데 본 연구에서는 존속 사업체의 선택적 에디팅을 먼저 실시하고 추정영역 내 존속 사업체의 정보를 이용하여 신생 사업체의 항목점수 산출을 위한 예상 값을 결정하였다. 예상 값이 결정되면 전체 사업체 자료의 중요변수별 항목점수가 산출되고 이를 통해 선택적 에디팅 대상을 결정하기 위한 개체점수(unit score)를 산출한다. 일반적으로 개체점수에 영향을 미치는 중요변수는 동일한 중요도를 부여한다. 그런데 실제로는 자료 구성 목적, 활용 등을 고려하여 추정되는 모수의 중요도는 다르다. 본 연구에서는 로지스틱 회귀분석(logistic regression)을 통해 중요변수의 중요도를 계산해서 이를 가중치로 활용하여 사업체 자료의 최종 개체점수를 산출하는 방안을 제시하고 가중치 산출 방법과 적용 여부 결과를 비교하였다.

In this study, we suggested the customized selective editing in business data through to analyze the modified workplace panel survey (WPS) data. As most of business data is panel data, there are problems that can t use previous value when we calculate the item score of birth business while selective editing. Generally, predicted value of birth business was determined by imputation. But we are determined predicted value of birth business to calculate item score through use to information of survival business after performing selective editing about survival business. And then we also calculate the item score after predicted value was determined. We are select the business for editing through the unit score. At the time, the importance of key variables are equaled but importance differs depending on the data s purpose and use. Thus, we suggested way to calculate final unit score after we was calculated the weight of key variables through logistic regression. And we could see the difference in the editing target.

1. 서론

2. 선택적 에디팅

3. 선택적 에디팅 방법의 확장

4. 자료분석

5. 결론

