论文部分内容阅读
测验等值(equating)是把测量同一种心理特质、难度和分数分布不同的测验分数,通过一定的数学模型转换到统一单位系统中的过程.目前关于等值的研究绝大多数是基于0-1评分或多级评分的非题组测验等值.然而随着题组题型越来越多的出现在各类考试之中,对于含有题组测验的等值研究势在必行.一般而言,当测验中包含题组题型时,IRT的局部独立性假设可能被违背,为了解释这种项目间的局部依赖特性,Bradlow,Wainer和Wang (1999)在传统的IRT模型基础上,在同一个题组内引入了一个新的参数——随机题组效应参数γd(i)).由于题组效应是随机变量,不能直接得到,所以通常采用题组效应的方差σ2γ作为题组效应的指标.已有研究表明0.25以下的题组效应可以忽略(Zhang et al,2010),但在大量语言类测验中,题组参数的方差一般在0.5-2范围内(Wang et a.1,2002;Zhang, 2010).