상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
156266.jpg
KCI등재 학술저널

다층자료에 대한 벌점화 회귀모형의 모수추정값과 예측성과 비교 연구

A Comparison Study on the Parameter Estimates and Prediction Performance of Penalized Regression Models for the Multilevel Data

  • 155

본 연구는 다층자료 구조를 반영하지 못한 벌점화 회귀모형의 명세화 오류 영향을 탐색하고자 수행되었다. 이를 위해 다양한 집단 내 상관계수(0.1, 0.2, 0.4), 2수준(200, 300, 400, 500) 및 1수준(20, 30, 50) 표본크기 조건을 고려하여 생성한 모의자료에, 다층자료 구조를 고려한 벌점화 회귀모형인 glmmLasso(generalized linear mixed model by-penalized estimation) 모형을 준거모형으로 설정하고, 다층자료 구조를 반영하지 못하는 전통적인 lasso(least absolute shrinkage and selection operator) 모형을 비교모형으로 설정하여 모수추정 값의 상대편의성과 예측성과를 비교하였다. 모의실험 결과, 모든 조건에서 다층자료 구조를 반영하지 못한 전통적인 lasso 모형을 적용하였을 때 독립변수의 모수추정값이 과소 추정되는 것으로 나타났다. 또한 모든 모의실험 조건에서 준거모형인 glmmLasso 모형이 비교모형인 전통적인 lasso 모형에 비해 예측성과가 높은 것으로 나타났다.

This simulation study investigated the effects of mis-specifying multilevel data structure in penalized regression models. The simulation conditions were considered as follows: intra-class correlation coefficient (0.1, 0.2, and 0.4), level-2 sample size (200, 300, 400, and 500), and level-1 sample size (20, 30, and 50). This study compared the relative biases of parameter estimates and prediction performance between glmmLasso model (generalized linear mixed model by-penalized estimation, Groll & Tutz, 2014) that correctly models the multilevel data structure and traditional lasso regression model (least absolute shrinkage and selection operator, Tibshirani, 1996) that excludes level-2 random effects. The results are as follows. The fixed effects were substantially negatively biased under the lasso regression model across all conditions. In addition, the glmmLasso model showed better prediction performance than traditional lasso regression model across all conditions investigated in the current study.

Ⅰ. 서 론

Ⅱ. 이론적 배경

Ⅲ. 연구방법

Ⅳ. 연구결과

Ⅴ. 논의 및 결론

로딩중