多级评分的多维计算机化自适应测验选题策略研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:magicMan555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多维计算机化自适应测验(MCAT)将计算机化自适应测验(CAT)与多维项目反应理论(MIRT)相结合,以尽可能多得获取被试的多维特质信息为目的,在保证测验准确高效的同时,还具有从被试反应中获取诊断信息的潜力。多级评分项目因能提供更多信息并可测量更复杂的能力和技能而被广泛应用。然而,目前大多数MCAT算法技术是以M3PL或M2PL模型为条件的,这些算法与技术可能并不适用于多级评分模型。本文的目的是探讨将MCAT中的选题策略拓展到PMCAT中,并开发出新的选题策略。本研究还进一步探索了测验维度数、维度间的相关大小如何影响PMCAT的准确性和安全性。一些常用的MCAT选题策略——包括基于FI的D-优化、A-优化、E-优化及其贝叶斯版本;基于传统KL信息量的KI方法、后验期望KL信息方法(KB);以及基于后验分布间KL距离的KLP方法、互信息(MUI)方法和连续熵方法(CEM)都被拓展以适合于多级评分的项目。通过将CEM算法中后验概率的计算公式中预设的固定的先验概率替换为随着测验不断更新的当前后验概率,对原有CEM方法进行了改进。然后展开了两项Monte Carlo模拟研究:一是验证了PMCAT的可行性(研究二),并比较了各种选题策略间的表现;二是进一步探索了能力维度数(p=2 and 5)以及维度间相关大小(r=0,0.2,0.5 and 0.8)这两个因素对估计精度及项目曝光率的影响(研究三)。本研究使用的多级评分模型为多维等级反应模型(MGREM),选择EAP为测验进行中的潜在特质估计方法,测验终止条件设置为定长。模拟试验表明,拓展的PMCAT选题策略基本合理、可行,本文开发的新选题策略(MCEM)整体表现最好。研究发现:(1)大多数选题策略的估计误差随着维度数的增加变大,而由2维到5维时,KI方法的估计精度提升了;(2)维度间相关只在中等强度以上时才对选题策略的估计精度有影响,KI方法的估计误差随着维度间相关增加显著下降;(3)维度数量越多,维度间的相关越高,项目曝光率越低。特别是A-优化方法,在2维时曝光率最高,在5维时其曝光率下降到最低。多级评分项目广泛应用于李克特式评分的心理测量量表和成就测验中。采用多级评分项目的MCAT具有广阔的应用前景。对于PMCAT选题策略的拓展可供理论研究和实际应用参考。
其他文献
为探究-18℃冻藏时间对养殖大黄鱼的体色和肌肉品质的影响,以冰鲜大黄鱼(F0)为对照,对其体表色差值、总类胡萝卜素含量、色素细胞大小和肌肉品质特征进行差异性分析。结果表
文章对目前发展农业科技期刊的优势和劣势进行了分析,认为只有根据我国农业发展和期刊生存的特点,调整办刊方向、提高刊物质量、搞活经营方式才是期刊发展壮大的有效措施。
随着互联网移动技术的飞速发展,APP已经成为人们生活工作中不可或缺的一部分,本文描述了对APP开发的流程框架以及流程中各环节的设计方法和内容,力图站在UI设计师的视角分析A
小学阶段所开展的语文教学,不仅要引领学生去学习相应的语文基础知识,同时也要锻炼学生的群文阅读能力,使学生能够去对相应的阅览材料进行分析,掌握文章当中所复函的丰富情感
新农村建设并不是要把农民都留在农村;科技创新不是公益事业;国家应出资发展社区医院
依法治理是全面推进依法治国不可或缺的内容,是农村未来发展的趋势和方向。目前农村治理还面临着依法治理表里不一和基层普法缺乏实效的问题。推进农村依法治理,一方面,要调
“医院(综治副院长)是虚设,虚设的还搞得跟真的一样,(我们)气得不得了。”    随手抓一把空气,轻轻一攥就能出水,武夷山市已经多日细雨霏霏了。    输入“民警副院长”,google在0.19秒的时间内,显示有11.9万条相符信息。这是《小康》记者2007年5月7日查询的结果,此时距4月11日《东南快报》发表“医院聘民警当副院长防医闹”的新闻,已近一个月。  2007年4月28日,略显倦怠的武夷
若你问起我的心爱之物是什么,我肯定会说是我妈妈给我买的一把漂亮的木吉他。这把吉他是杉木做的,吉他的琴板油光发亮,色彩明丽,轻轻的弹一下弦,就会发出十分优美动听的声音
在首批获得内地法人资格的四大银行中,在资产上东亚并无优势,而它能够济身于英美银行大鳄之间拔得头筹,可以说得益于它与内地之间的“亲情牌”。