论文部分内容阅读
20世纪以来,基于项目反应理论(Item Response Theory,IRT)的计算机化自适应测验(Computerized Adaptive Test,CAT)由于其相对于传统的纸笔测验更加的灵活、高效,所以越来越受到人们的青睐,应用越来越广泛。本文对CAT中GRM模型中不定长测验下的几个选题策略进行分析,得出各个项目的信息量与区分度组合函数的值越是集中,其项目调用越均匀。所以,在现有的选题策略的基础上,将Fisher信息量与区分度参数a组合的函数转化为指数小于1的指数函数,使得其函数值分布的更为集中,这样项目在调用时会更加的均匀,从而提高了题库的利用率和测试的安全性。但是题库安全性能的提高将导致测量的精度和测验的效率降低,为了兼顾测量的精度和题库安全性,本文又定义了曝光因子控制指数函数,通过这一函数逐步弱化曝光因子在选题策略中的影响力,增大信息量大的项目被选中的可能性,提升测量精度和测验的效率。最后分别将两个新的选题策略应用于GRM模型中的定长测验和0-1评分的3PLM模型的定长和不定长测验中。新策略一在项目调用均匀性和题库安全性上均有明显的提高,新策略二在测量精度上均优于其他几个作比较的选题策略。另外,本文还对CAT中按a分层的不定长终止规则进行了研究分析,发现减小测验信息量较低的层的在整个测验信息总量的比重,增加信息量较高的层的在整个测验信息总量的比重,有助于人均用题数和测验效率的优化,所以设计了两个新的终止规则。新的终止规则在项目调用均匀性、人均用题数、测验效率、测验重叠率上均有所的优化,并且在GRM不定长模型中,在优化了项目调用均匀性、人均用题数、测验效率、测验重叠率的同时还能兼顾到测量的精度。