论文部分内容阅读
当下,心理测量学研究的一个热门主题是认知诊断(Cognitive diagnosis)。认知诊断评估是一种使用认知模型的测验形式,首先开发衡量特定知识和技能的项目,然后使用该模型对被试项目反应的心理进行计量分析,测量特定的知识结构和技能,以便向被试提供有关其认知优势和弱势的信息。属性信度是指被试属性掌握水平上得分的准确性。在认知诊断测验领域,已有Gierl, Cui和Zhou(2009)的Cronbach’sα系数属性信度,是一种在被试项目得分上加权的分数信度,这一思路改进了Cronbach’sα系数。以上的点估计方法用样本代替全体指标,不可避免会产生误差,而区间估计是推断全体指标的一个可能范围,精度性能大大提高。但现在国内外尚无研究探讨认知诊断的Cronbach’s α系数属性信度区间,所以,十分有必要开发出认知诊断Cronbach’sα系数属性信度区间估计方法。认知诊断Cronbach’sα系数,它作为通过在特定属性项目上的两个加权分数方差之比或作为重测相关系数的计算,继承了经典测量理论信度定义方式,因此把该认知诊断信度系数看成相关系数,采用经典测量理论中信度区间估计的方法,以此得到认知诊断Cronbach’sα系数属性信度的区间估计(Feldt, 1965;Fisher, 1950)。因此,本研究在借鉴经典测量理论 α 系数区间估计方法的基础上,探讨认知诊断Cronbach’sα系数属性信度置信区间估计方法,科学地推动认知诊断属性信度区间估计的研究进展。
本文共有三个研究,研究一探讨认知诊断Cronbach’sα系数属性信度的点估计的表现,并且评价Cronbach’sα系数属性信度点估计的精确性。研究二将经典测验理论α系数的十种区间方法,引入到认知诊断Cronbach’sα系数属性信度区间估计方法,考察十种区间估计方法的结果,从而推荐较好的方法。研究三将比较十种区间估计方法在实证数据中的表现。结果如下:
(1)研究一表明:测验长度、被试量和测验质量会影响认知诊断Cronbach’sα系数属性信度均值,信度均值随题目数量和被试量的增加有提升趋势;信度均值随题目质量的上升会有较大的提高。认知诊断Cronbach’sα系数属性信度值的bias、RMSE随着题目数量、被试量和测验质量的增加而减少。
(2)研究二表明:测验长度、被试量和测验质量会影响认知诊断 Cronbach’sα系数属性信度十种区间估计方法。置信区间长度随着题目数量和被试量的增多呈变短的趋势;置信区间长度随着题目质量的上升而变短。
(3)研究二还表明:第5种方法(Feldt法)和第7种方法(精确Koning-Franses法)较好,它们的结果也相差较小,计算过程也比较简单,只需要认知诊断Cronbach’sα系数属性信度系数值、被试数量、F临界值、题目数量,便较容易得到认知诊断Cronbach’sα系数属性信度区间。
(4)研究三表明:使用Tatsuoka分数减法数据这一个真实数据,第5种估计方法(Feldt法)的置信区间长度最短,这个结果与研究二的结果一致。
本文共有三个研究,研究一探讨认知诊断Cronbach’sα系数属性信度的点估计的表现,并且评价Cronbach’sα系数属性信度点估计的精确性。研究二将经典测验理论α系数的十种区间方法,引入到认知诊断Cronbach’sα系数属性信度区间估计方法,考察十种区间估计方法的结果,从而推荐较好的方法。研究三将比较十种区间估计方法在实证数据中的表现。结果如下:
(1)研究一表明:测验长度、被试量和测验质量会影响认知诊断Cronbach’sα系数属性信度均值,信度均值随题目数量和被试量的增加有提升趋势;信度均值随题目质量的上升会有较大的提高。认知诊断Cronbach’sα系数属性信度值的bias、RMSE随着题目数量、被试量和测验质量的增加而减少。
(2)研究二表明:测验长度、被试量和测验质量会影响认知诊断 Cronbach’sα系数属性信度十种区间估计方法。置信区间长度随着题目数量和被试量的增多呈变短的趋势;置信区间长度随着题目质量的上升而变短。
(3)研究二还表明:第5种方法(Feldt法)和第7种方法(精确Koning-Franses法)较好,它们的结果也相差较小,计算过程也比较简单,只需要认知诊断Cronbach’sα系数属性信度系数值、被试数量、F临界值、题目数量,便较容易得到认知诊断Cronbach’sα系数属性信度区间。
(4)研究三表明:使用Tatsuoka分数减法数据这一个真实数据,第5种估计方法(Feldt法)的置信区间长度最短,这个结果与研究二的结果一致。