상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
post.jpg
KCI등재 학술저널

인자의 불확정성을 반영한 인자점수 추출 및 인자점수 회귀모형에의 응용

Extraction of factor scores reflecting factor indeterminacy and application to factor score regression model

DOI : 10.37727/jkdas.2023.25.6.2121
  • 15

인자분석(factor analysis)은 다변량 자료로부터 잠재인자를 추출하여 차원축소를 통한 다차원 자료 해석에 많이 사용되고 있는 분석법이다. 또한 추출된 인자에 대한 개별 관측치들의 인자점수(factor scores)를 산출하여 후속적인 회귀분석에 활용하기도 한다. 이러한 인자모형은 인자적재행렬이나 특이분산 등의 모수가 일의적으로 결정되지 않는 모수의 불확정성(parameter indeterminacy)과, 인자모형의 모수가 결정된 상황에서도 잠재인자가 일의적으로 결정되지 않는 인자의 불확정성(factor indeterminacy)이라는 특성을 갖는다. 본 논문에서는 인자의 불확정성과 이를 계량화한 거트만 기준값에 대하여 살펴보고, 인자점수 산출시 인자의 불확정적인 부분까지 반영하여 추정함으로써 이를 활용하여 인자점수 회귀모형의 설명력과 예측의 정확도를 높이고자 한다. 즉, 인자점수를 설명변수 값으로 활용하는 인자점수 회귀모형에서 반응변수와 인자간의 상관계수가 최대가 되도록 인자의 불확정적 부분을 반영한 인자점수를 추출하여 활용하는 방법을 제안한다. 기존의 인자점수와 수정된 인자점수를 기반으로 하는 회귀모형을 모의실험과 실제 데이터에 대한 분석을 통하여 비교한다. 데이터 분석 결과 제안된 인자점수를 이용하는 경우에 회귀모수 추정의 정밀도 및 추정된 회귀모형의 설명력이 더 높음을 확인하였다.

Factor analysis is a multivariate analysis method widely used to extract latent factors from high dimensional data and interpret multidimensional data through dimension reduction. Additionally, factor scores of individual observations for the extracted factors are calculated and used in a subsequent regression analysis. This factor model has the characteristics of parameter indeterminacy which means parameters such as the factor loading matrix or unique variance are not uniquely determined, and factor indeterminacy which represents that latent factors are not uniquely determined even in situations where the parameters of the factor model are determined. In this paper, we examine the indeterminacy of factor scores and propose a new method of calculating factor scores that maximize the correlation coefficient between a response variable and a factor in a factor score regression model. Simulations and real data analysis were conducted to compare the existing factor scores using the regression method and the proposed factor scores utilizing the indeterminate part of factors in factor score regression setting. As a result of data analysis, it was confirmed that the estimation accuracy of regression model was higher when using the proposed factor scores.

1. 서론

2. 인자의 불확정성과 인자점수 회귀모형

3. 모의실험 및 자료분석

4. 결론

References

로딩중