论文部分内容阅读
随着心理测量学和认知心理学的发展,认知诊断模型受到越来越多的重视,传统的测验理论只能从宏观上分析被试的能力,而认知诊断理论则探索到被试能力的微观方面,关注宏观能力背后的具体属性(或技能)及其结构。但认知诊断模型的优势必须基于所采用的模型与实际数据资料拟合较好的情况,如此做出的推论才会有效,而当所采用认知诊断模型与资料不拟合或选择了错误的模型,则会导致如参数估计、测验等值及项目功能差异分析等具有较大误差,给实际工作带来不良影响。因此,在使用认知诊断模型分析时,应首先充分考察及检验所选模型与实际数据是否相拟合。认知诊断领域中常用模型-资料拟合检验统计量包括项目拟合检验统计量和测验拟合检验统计量。项目拟合检验是在项目水平上评估模型与实际资料是否相吻合,可用于筛选测验中的个别项目,一般是绝对拟合检验;而测验拟合检验则是在测验整体水平上评估选用的模型与实际资料是否相吻合,一般是相对拟合检验。虽然项目拟合统计量可以指导测验项目的选择,但现实情况中研究者往往不知道用哪种模型去拟合资料,此时若用项目拟合统计量盲目地检验测验中所有项目的拟合就不太合理。此外,项目拟合统计量一般是绝对拟合统计量,而评价模型绝对拟合存在一定困难,因此研究者常常只评价模型相对拟合;并且,当有几个模型都能拟合资料时,相对拟合统计量可以帮助选择更合适的模型。认知诊断模型-资料拟合检验是心理、教育测量领域的重要主题,也是测验分析过程中较易忽视的环节,目前鲜有此类公开发表的文章。研究认知诊断领域的模型-资料测验拟合统计量,主要是为了研究各统计量的有效性和灵敏度,可从两方面着手,一是检验各统计量是否能选择最适合资料的模型,二是检验各统计量是否能选择最适合资料的Q矩阵。目前认知诊断领域常用测验拟合统计量包括-2LL、AIC、AICc、BIC及DIC4,本文拟在比较不同的样本量、题量、属性数下各统计量对正确模型的选择率,以及比较各统计量在Q阵选择上的灵敏度,并且拓展项目反应理论中表现较好的CVLL法,检验其在认知诊断领域的有效性和灵敏度。最后用Tatsuoka分数减法数据和ECPE(examination for the certificate of proficiency in English)数据说明各统计量在实证数据中的应用。研究表明,认知诊断中AIC、BIC比AICc表现更好,CVLL在CD领域表现良好,较其它统计量更优,当样本量小题量大时AICc、BIC相较复杂模型倾向于选择简洁模型,当属性数过多时,各统计量选择正确模型的概率大幅下降,只有CVLL表现较好,在R-RUM中,各统计量选择正确Q阵的比率有所下降,CVLL表现最好。实证研究表明三个模型均不适合Tatsuoka分数减法数据和ECPE数据,但相较之下R-RUM拟合更好。