论文部分内容阅读
大型考试通常要将参加不同测验形式的考生能力参数进行等值转换,以在同一个量尺上比较不同测量的结果。通过设置共同铆题进行等值是一种常用的方法,这种方法不仅要求铆题具有内容形式上的代表性,也要求铆题在两份试卷上功能稳定一致。由于受到某些与测量目标无关的因素影响,项目参数在不同施测时间会发生改变, Goldstein(1983)称这种现象为项目参数漂移(Item Parameter Drift,IPD)。本质上,项目参数漂移与项目功能差异(DIF)探讨的都是测量不变性问题,但与DIF研究相比,对项目参数漂移的研究不多,且已有研究关注的多是难度参数下降的情况。目前尚未有研究涉及铆题难度和区分度同时漂移时对等值的影响。本文研究一通过模拟作答数据,在2种等值设计、4种参数铆题漂移所占比例和8种铆题参数漂移模式下,比较平均数/标准差法(M/S)、特征曲线法(TCC)和同时校准(CC)三种方法的表现,研究发现:(1)随发生参数漂移铆题数量的增加,三种等值方法的等值偏差基本上都呈增加趋势,但各种方法的敏感性有所不同,且会受到两组被试能力差异的影响。(2)在各种参数漂移模式之中,区分度参数正向漂移(a+)导致的等值偏差最小。与难度参数漂移方向相同(a+b+,a-b-)相比,区分度和难度参数漂移方向不同(a+b-,a-b+)导致的等值偏差要更大。(3)三种等值方法在不同的参数漂移模式下表现不同,没有一种等值方法具有绝对优势。但删除参数漂移铆题后,绝大多数情况下,三种方法的等值偏差都会减小。(4)在无铆题发生参数漂移时,在等组设计下,TCC的等值偏差小于M/S,但在不等组设计下则相反;在两种等值设计下,CC的等值偏差都小于M/S和TCC。本文研究二采用MH检验和logistic回归检验了我国一大型考试的铆题质量,结果发现,有22个铆题存在参数漂移问题,导致了较多铆题在2007年的数据中无法通过模型拟合检验;采用平均数/标准差法进行等值计算,发现在删除参数漂移铆题前后,计算结果变化较大。很明显,不删除铆题参数漂移问题将导致较大的等值误差,应将铆题参数漂移检查作为等值中的一项常规工作。文章最后探讨了本文模拟研究中的一些局限,对项目参数漂移的未来研究给出了参考建议。