본 연구의 목적은 대학수학능력시험의 난이도에 영향을 미치는 요인을 탐색하여 실제 검사 개발뿐만 아니라 학문적 탐구를 활성화하기 위하여 언어 읽기 영역, 수리 영역, 영어 읽기 영역의 문항의 난이도를 예측하기 위한 통계적 모형을 찾는 것이다 각 영역별로 내용분석 및 전문적 판단에 근거하여 난이도를 설명할 수 있는 독립변인을 추출한 다음. 난이도 관련변인 검토도구를 제작하여 인문계 상위 50%의 영역별 예측 모형을 개발하였다 예측 모형의 개발을 위해서 2OO2·2003학년도 수능 문항을 이용하였고 2004학년도 9월 모의평가을 이용하여 그 타당성을 검토하였다. 언어 읽기 영역과 영어 읽기 영역은 2003수능 희귀방정식 모형이, 수리 영역은 통합 희귀방정식 모형이 가장 안정성과 예측력이 높은 것으로 나타났다. 최종 예측 모형의 독립변인은 영역별로 다소 차이가 있었고 모형의 설명력도 영역에 따라서 서로 다름을 확인할 수 있었다 그러나 본 연구는 고전검사이론에 근거한 난이도를 종속변인으로 이용함으로써 각 연도별 문항 난이도가 동일 척도 위에 있다고 볼 수 없다는 한계점이 있었다 이러한 제한점을 극복하기 위해서는 동등화 검사 설계 등의 후속 연구가 필요할 것으로 판단된다
The purpose of this study was to develop a Statistical model of predicting item difficulty index by investigating variables chat are significantly correlated to test item difficulty of Korean, Math, and English in CSAT. It was assumed that the study finding would provide useful implications to the test design and further research. As the initial step of the investigation, independent variables related to rest item difficulty were selected on the basis of sources such as literature review, test item responses, and professionals' reviews. Using the selected variables, an instrument of each teat area was designed to measure test item difficulty of each area. Models of predicting test difficulty were produced as an outcome of the statistical analyses of the gathered data by applying the instrument to 2002 and 2003 CSAT. To validate the models across the data of different year, they were applied to the pre-test of September 2004, It was found that the linear 'regression equation model of 2003 CSAT for Korean and English reading tests, and the 'integrated regression model' for Math test showed acceptable levels of stability and predictability. It was also found that predictors and the proportion of variance accounted by the predictors differed across subjects. The limitation of the present study lies in the use of difficulty index based on classical test theory, which makes it difficult to assume that item difficulty indices across years are on the same metric. It is suggested that further research including equating test design is needed to overcome the limitation.
Ⅰ. 연구의 필요성 및 목적
Ⅱ. 연구방법
Ⅲ. 연구 결과
Ⅳ. 논의
참고문헌
ABSTRACT
(0)
(0)