论文部分内容阅读
多维计算机化自适应测验(MCAT)将计算机化自适应测验(CAT)与多维项目反应理论(MIRT)相结合,以尽可能多得获取被试的多维特质信息为目的,在保证测验准确高效的同时,还具有从被试反应中获取诊断信息的潜力。多级评分项目因能提供更多信息并可测量更复杂的能力和技能而被广泛应用。然而,目前大多数MCAT算法技术是以M3PL或M2PL模型为条件的,这些算法与技术可能并不适用于多级评分模型。本文的目的是探讨将MCAT中的选题策略拓展到PMCAT中,并开发出新的选题策略。本研究还进一步探索了测验维度数、维度间的相关大小如何影响PMCAT的准确性和安全性。一些常用的MCAT选题策略——包括基于FI的D-优化、A-优化、E-优化及其贝叶斯版本;基于传统KL信息量的KI方法、后验期望KL信息方法(KB);以及基于后验分布间KL距离的KLP方法、互信息(MUI)方法和连续熵方法(CEM)都被拓展以适合于多级评分的项目。通过将CEM算法中后验概率的计算公式中预设的固定的先验概率替换为随着测验不断更新的当前后验概率,对原有CEM方法进行了改进。然后展开了两项Monte Carlo模拟研究:一是验证了PMCAT的可行性(研究二),并比较了各种选题策略间的表现;二是进一步探索了能力维度数(p=2 and 5)以及维度间相关大小(r=0,0.2,0.5 and 0.8)这两个因素对估计精度及项目曝光率的影响(研究三)。本研究使用的多级评分模型为多维等级反应模型(MGREM),选择EAP为测验进行中的潜在特质估计方法,测验终止条件设置为定长。模拟试验表明,拓展的PMCAT选题策略基本合理、可行,本文开发的新选题策略(MCEM)整体表现最好。研究发现:(1)大多数选题策略的估计误差随着维度数的增加变大,而由2维到5维时,KI方法的估计精度提升了;(2)维度间相关只在中等强度以上时才对选题策略的估计精度有影响,KI方法的估计误差随着维度间相关增加显著下降;(3)维度数量越多,维度间的相关越高,项目曝光率越低。特别是A-优化方法,在2维时曝光率最高,在5维时其曝光率下降到最低。多级评分项目广泛应用于李克特式评分的心理测量量表和成就测验中。采用多级评分项目的MCAT具有广阔的应用前景。对于PMCAT选题策略的拓展可供理论研究和实际应用参考。