문항반응이론(IRT)을 활용하여 문항 모수와 능력 분포 모수를 동시에 추정할 때, 주변최대우도(MML) 혹은 베이지안 최빈(BM) 방법을 사용할 수 있다. 본 연구의 일차적 목적은 동시 추정이 필요한 다집단 검사 상황을 전제로 MML/BM 모수 추정량의 표준오차 추정 공식을 일반적으로 제시하는 데 있다. 또 다른 목적은 일반적인 표준오차 추정 공식을 1모수 로지스틱(1PL) 모형 검사에 대한 공식으로 구체적으로 제시하고, 추정 공식의 정확성을 경험적 자료를 통해 검토하는 데 있다. 이를 위해 검사의 유형(단일집단 및 다집단 검사), 모집단 능력 분포(2개의 정규 분포), 표본 크기(N=250 및 N=1,000), 척도화 방식(0-1 척도화 및 Rasch 척도화) 등의 요인을 포함한 모의실험을 수행하였다. 0-1 척도화 방식이 사용될 때, 검사의 유형과 능력 분포에 상관없이, 문항 및 분포 모수는 큰 편향 없이 적절히 추정되었고, 각 모수 추정량의 표준오차 또한 기대되는 대로 적절히 추정되었다. 한편, Rasch 척도화 방식이 사용될 때, 단일집단 검사 조건에서는 문항 및 분포 모수를 큰 편향 없이 추정하였으나, 다집단 검사 조건에서는 집단 간 능력 차이가 클 때 문항 모수를 다소 과소 추정하는 경향을 보였다. 그러나 검사의 유형과 상관없이 각 모수 추정량의 표준오차는 적절히 추정되었다.
When estimating the parameters of items and ability distributions concurrently using item response theory (IRT), either the marginal maximum likelihood (MML) or Bayesian modal (BM) method can be used. The primary purpose of this study is to present a general formula for estimating the standard errors of the MML/BM parameter estimators under the premise of a multi-group testing situation that requires concurrent estimation. The second purpose is to present the standard error estimation formula in a form suitable for 1PL model-fit tests and to verify the accuracy of the estimation formula with empirical data. To this end, computer simulations were conducted where four factors, test type (single- & multi-group tests), distribution type (normal distributions), sample size (250 & 1,000), and scaling method (0-1 scaling & Rasch scaling), were considered. When using the 0-1 scaling, regardless of test type and ability distribution, the item and distribution parameters were appropriately estimated with little bias, and the standard errors of parameter estimators were also appropriately estimated. On the other hand, when using the Rasch scaling, item and distribution parameters were estimated without significant bias in the single-group test conditions, but item parameters tended to be somewhat underestimated in the nonequivalent multi-group test conditions. However, regardless of test type, the standard errors of parameter estimators were appropriately estimated.
Ⅰ. 서론
Ⅱ. 다집단 IRT 추정에서 MML/BM 모수 추정량의 표준오차
Ⅲ. 모의실험 연구
Ⅳ. 연구결과
Ⅴ. 논의 및 제언
참고문헌
(0)
(0)