论文部分内容阅读
通常把测验中共用同一刺激(Stimulus)的项目集合称为题组(Testlet),并把由共同刺激引起的题组项目反应问的相依性称为题组效应(Testlet-effect)。目前国内外关于题组反应模型(Test1etResponseModel,TRM)的已有研究均假设题组项目反应仅受到1个共同刺激的影响,继而已开发的TRM中也仅包含了1个题组效应参数。但在实际测验中题组项目反应可能同时受到多个共同刺激(如:单元、阅读材料、题型,甚至是不同的评分者)的影响,这是已有题组反应模型所无法处理的。首先,本研究对"题组"概念做了新的诠释,认为:当多个项目问存在共同刺激且被试对这些项目的反应受到共同刺激影响时,这些项目组成的集合就可被成为题组,而对于项目集合以及共同刺激的形式并不限于捆绑式题组(Bundled testlet)中的形式。所以某项目就可能因为与其他项目共用不同的刺激而被同时划分到不同的题组之中,进而被试在该项目上的反应就会包含多个题组效应,可称之为项目内多维题组效应(Within-item muhidimensional testlet-effects)。之后,为了实现对项目内多维题组效应的处理,本研究同时开发了二级评分和多级评分的多维题组效应Rasch模型心4ultidimensional Testlet-.Effects Rasch,Model,MTERM),新模型亦可以看作是对Rasch题组模型(Rasch Testlet Model,RTM)(Wang&Wilson,2005)的多维度拓广。之后,通过设计模拟测验并采用Con(Quest软件实现对模拟测验数据的分析,认为Con(Quest软件可以在复杂的测验设定下为MTERM提供很好的返真性。对于二级评分项目,将MTERM与RTM和标准项目反应模型(Rasch模型和分部评分模型)对比研究后认为MTERM能更好地处理包含项目内多维题组效应的测验数据,能为测验设计和分析人员提供更加准确的参数估计。