상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
학술저널

연속형 변수가 모형화될 때 Hosmer-Lemeshow 검정을 이용한 로지스틱 회귀모형의 모형적합도

The Goodness-of-fit of Logistic Regression Models with Continuous Covariates through Hosmer-Lemeshow Statistics

  • 960
111502.jpg

일반화 선형모형 중 종속변수가 예/아니오 등의 이항형일 때 로짓 링크(logitlink)를 이용하는 로지스틱 회귀모형이 가장 많이 쓰인다. 연속형 독립변수를 로지스틱 회귀모형에서 이용하는 경우에 가정 위배 문제가 야기되므로, Pearson 카이제곱 검정이나 이탈도 등을 통하여 모형적합도를 알아볼 수 없다. 이 경우 Hosmer-Lemeshow검정을 이용할 수 있으나,이에 대한 이해가 부족한 형편이다. 본 연구에서는 Monte Carlo 모의실험을 통하여 표본 크기, 모형 설정, 변수 간 상호작용 강도,Hosmer-Lemeshow검정의 집단 수 등에 따라 기각률(rejectionrate)이 어떻게 달라지는지 연구하였다. 연구 과, Hosmer-Lemeshow 검정이 주효과 항과 상호작용 효과 항이 누락된 모형에 대하여 잘 감지하지 못한다는 것을 알 수 있었다. 표본 크기가 2000으로 큰 경우에도 Hosmer-Lemeshow검정의 집단 수를 20으로 상향하는 것이 기각률에 그다지 영향을 끼치지 못하였다. Hosmer-Lemeshow의 대체 검정법 연구는 물론이고, Hosmer-Lemeshow 검정을 순서형 또는 다항형 변수로 확장하는 방법에 대한 연구도 필요하다.

Conventional test statistics such as Pearson chi-squares or Deviance are no more a viable option for testing goodness-of-fir, when continuous explanatory variables are included in the logistic regression model. Hosmer-Lemeshow statistics has been the most popular goodness-of-fit statistics in this cast, but little has been investigated. This Monte Carlo simulation study examined the effect of sample size, model specification, degrees of interactions among variables, and number of groups on the Hosmer-Lemeshow statistics’ rejection rates. Overall, the Hosmer-Lemeshow statistics was quite conservative. "When the sample size was 2000 and the interaction among explanatory variables was as high as 0.90, the Hosmer-Lemeshow statistics rejected the interaction-term-omitted model at the rare below 10%. The rejection tarts of the main-effect-omitted model were even lower, ranging between 4~5%. Further studies are warranted regarding better approaches.

Ⅰ. 서 론

Ⅱ. 이론적 배경

Ⅲ. 연구 방법

Ⅳ. 결 과

Ⅴ. 논 의

참고문헌

<ABSTRACT>

(0)

(0)

로딩중