분별도 지표로서 문항․총점 상관계수의 활용

The Usability of Item-Total Correlation as the Index of Item Discrimination

시험에 사용된 문항이 잘 제작 되었는지를 평가하는 과정인 문항분석에는 대개 난이도와 분별도,그리고 오답분석의 3가지가 이용된다. 이들 중 분별도는 주로 양극집단법에 의한 분별도 지수(D)를 이용하여 왔으나, 양극 집단 내에 속한 수험생을 동일하게 처리한다는 점과 결과로 제시된 수치의 해석이 모호하다는 문제점이 있다. 문항․총점 상관계수(ITC)는 계산이 복잡하다는 단점이 있지만, 이러한 문제점을 해결하는 것으로 알려져 왔다. 이러한 배경에서 문항․총점 상관계수의 활용성을 평가해보기 위하여 실제 시험에 적용한 후 이를 양극집단법에 의한 분별도 지수와 비교 분석하였다. 1996년 1월에 시행된 의사전문의 자격시험 중 내과, 일반외과, 소아과, 산부인과의 4개 전문과목 시험을 대상으로 하였으며, 시험 문제 수와 응시자 수는 각 전문과목별로 각각 120문항/428명, 140문항/219명, 140문항/229명, 140문항/226명 이었다. 대상 문항 전체의 분별도 지수는 평균 0.170, 표준편차 0.12였고, 문항·총점 상관계수는 평균 0.210, 표준편차 0.117 로 나타나, 문항․총점 상관계수가 분별도 지수보다 다소 높은 값을 보였다. 그리고 이들 사이에는 양의 상관관계가 있었다 (r=0.677). 문항․총점 상관계수는 범위가 0.880으로 분별도지수의 0.713보다 컸다. 특히 난이도가 0.9 이상으로 높은 값을 갖는 문항만을 대상으로 비교하면(n=140), 범위가 문항․총점 상관계수에서는 0.542, 분별도 지수에서는 0.273으로 그 차이가 더욱 두드러졌다. 이와 같은 결과로부터 문항․총점 상관계수 (ITC)를, 문항의 분별도를 나타내는데 있어서 분별도 지수 (D)를 대치할 수 있는 지표로 사용할 수 있음을 확인할 수 있었다. 또 문항․총점 상관계수는 그 자체로 통계적 의미를 가지고 있으므로 해석이 쉽다는 이론적인 장점 외에도 극단적인 난이도를 보이는 문항의 경우 난이도에 의한 오차 없이 분별도를 계산할 수 있다는 실용적인 장점도 확인하였다

Item analysis is the evaluating process of items used for tests. Item difficulty, discrimination, and distractor analysis are the main components of the analysis. Discrimination index(D) by the method of extreme groups had been used for the item discrimination, but it had been known to have some disadvantages compared to item-total correlation(ITC). This study was conducted to evaluated the feasibility and the advantages of the ITC. Medical specialist qualifying examination carried out in Jan. 1999 was selected for the study material and the items of tests for the 4 major disciplines(internal medicine, general surgery, pediatrics, and obstetrics & gynecology) were analysed. The numbers of the items and examinee are 120 items/428 persons, 140/219, 140/229, and 140/226 (in the order of IM, GS, Ped, OB & Gyn) respectively. The average discrimination index(D) of all items is 0.170 and the standard deviation is 0.120. For the ITC, average is 0.210 and standard deviation is 0.117. There is positive correlation between D and ITC(r=0.677). The variation of the ITC is 0.880, which is wider than that of discrimination index(D), 0.713. Especially on the items with item s p-value greater than 0.9(n=140), the variations are 0.542 and 0.273 respectively. The difference is much distinct. These results imply that ITC can be used as the index of the item discrimination, and has some advantages compared to discrimination index(D). The advantages are the significance of the number itself and rather independence from the item difficulty.


