论文部分内容阅读
基于项目反应理论(IRT)的计算机自适应测验(CAT)可以测量学生的能力或心理特质,得到被试的能力分数;基于认知诊断理论(CDT)的计算机自适应测验(CD-CAT)可以报告被试特定领域的知识结构、加工技能和认知过程,得到被试的知识状态。在实际的测验中,施测人员往往需要同时得到被试的能力和知识状态,但是对同一批被试分别施测两次测验(IRT-CAT和CD-CAT)耗时耗力,不符合CAT实践高效率、低耗时的要求。因此,一次测验同时报告能力和知识状态的需要引发了兼顾知识状态和能力的双目标认知诊断计算机自适应测验的诞生(dual-objective CD-CAT)。而无论是哪种CAT,选题策略都是核心。选题组卷的依据有多种,其中一种是区分度,它反应题目对不同特质被试的区分能力,直接影响测验的精度。通过对项目区分度的相关研究的梳理,发现目前尚未有学者提出适用于双目标认知诊断测验的项目区分度。因此,本文首先构建两个适用于双目标认知诊断测验的项目区分度(KLCDI和JSCDI),并且通过考察相关和组卷贡献情况验证其有效性。结果发现,KLCDI与已有的IRT区分度和认知诊断区分度的相关均较高,且在组卷中对知识状态和能力的判准精度贡献较大。因此KLCDI可以作为双目标认知诊断测验的项目区分度。在构建CD-CAT选题策略的方法中,结合题目信息和改进KL信息是两种基本思路。因此,本文依据这两条思路构建四个适用于双目标CD-CAT的选题策略(IPA-KLCDI,DPWKL1,DPWKL2,DSKL),并且首次验证选题策略DKL1和DKL2。通过和已有选题策略(JS,IPA,随机选题)在不同测验长度下的比较,结果发现,IPA-KLCDI在IPA的基础上能提高对知识状态和能力的判准精度。DPWKL1、DPWKL2、DSKL在JS、DKL1和DKL2的基础上均能提高测量精度,其中DPWKL1的测验精度、题库利用率均最高,测验重叠率最小,是一种较完善的选题策略。另外,DSKL在测验长度为40时对能力的测量精度最高。总的来说,针对双目标认知诊断测验的项目区分度和选题策略,本文都得到了较满意的结果。在今后的研究中还应加强双目标认知诊断测验多策略、属性多级评分和项目多级评分甚至更复杂测验条件下选题策略的构建,以及非参数选题方法的提出和实践应用。