论文部分内容阅读
作为现代测量理论核心内容的认知诊断评估(cognitive diagnostic assessment,CDA),是一种基于认知心理学并结合现代测量学的方法,旨在探索人类在特定领域的潜在认知过程和认知结构的测验形式。心理和教育领域的认知诊断评估的主要目的是要提供关于学生问题解决过程中认知技能掌握的诊断信息,以利于教与学。认知诊断评估这一目的的实现需要相应的具有认知诊断功能的测量模型即认知诊断模型(cognitive diagnostic model,CDM)来映射被试的不可观察的属性掌握和可观察的项目反应间的关系。由于认知诊断情境千变万化,需要开发各种各样的模型来描述现实。这使得认知诊断模型的研究成为认知诊断评估研究中的一大热点。在众多认知诊断模型中,确定性输入噪音与门模型(DINA模型)和缩减的再参数化统一模型(R-RUM)在国内外得到了广泛的关注和应用。虽同属于非补偿模型,两者关于项目反应中属性作用机制复杂程度的假设却迥然不同。DINA模型假设项目考察的所有属性对于项目正确作答影响相同,缺一不可。也就是说,在不考虑猜测的情况下,被试在某个项目的作答中,只要有一个属性(无论哪个)未掌握,其在该项目上的正确作答概率降为0。R-RUM则假设被试在项目上的正确作答概率随被试掌握所需属性个数增加而增加,且项目中每个属性对项目作答的重要程度不一样,即项目内各属性异质。所以,依据R-RUM的认知假设,被试在作答项目时,对于某个属性的缺失会令其正确作答该项目的概率降低,其降低的具体幅度取决于该属性对于这个项目正确作答的重要程度。可见,DINA模型所假设的属性作用机制较为简单;而R-RUM所假设的属性作用机制较为复杂。鉴于DINA模型和R-RUM对认知假设的表征无法覆盖现实情境中属性作用机制的各种复杂程度,难以满足现实诊断中的多样化的需求,本研究提出改进的DINA模型(Revised deterministic inputs, noisy “and” gate, R-DINA),以一定程度上弥补DINA模型与R-RUM在认知假设复杂程度之间的空缺。之所以称之为R-DINA模型,是因为该模型是在DINA模型的基础上改进而来。新模型假设各属性对于项目正确作答的影响是同质的,且被试掌握项目所测属性的数量越多,正确作答项目的概率越大。新模型与DINA模型一样简单,只有两个项目参数,但较之DINA模型,它能够更为细致地区分被试。从认知假设角度来看,DINA,R-DINA和R-RUM三个模型,是由强到弱,由简单到复杂的关系。认知诊断模型的开发与选用是认知诊断评估实践中一个十分关键的问题。认知诊断模型与测验项目反应机制之间的良好匹配是保证认知诊断评估结果有效、准确的基本前提。心理和教育测量领域的认知诊断测验大多是技能密集或知识密集的,在一次测验中,项目反应机制可能不是单一的,既有复杂的也有简单的。这就使得测验的分析既需要DINA模型,又需要R-DINA模型、R-RUM或其它模型。围绕新模型R-DINA能否实现参数估计,其诊断性能如何,以及实践中如何对模型与项目认知假设进行匹配,选择恰当模型进行相应分析等问题,本文相应地展开了以下三项研究:研究一(论文第三部分):对R-DINA模型进行了定义,并采用EM算法和马尔可夫链蒙特卡洛(MCMC)算法自编程序实现了模型参数估计。设计了模拟实验,从项目参数返真性、知识状态判准率和分类一致性等指标,对R-DINA模型EM算法和R-DINA模型MCMC算法的表现进行了评价。结果表明:(1)自编的EM算法和MCMC算法参数估计程序基本正确,EM算法和MCMC算法估计程序结果稳定。(2) EM算法和MCMC算法对于R-DINA模型进行参数估计得到的项目参数返真性较好,知识状态判准率较高。EM算法稍好于MCMC算法。研究二(论文第四部分):从模型资料拟合、项目参数返真性、知识状态判准率、被试分类一致性和模型预测能力等方面对DINA,R-DINA和R-RUM三个模型的表现进行了比较,通过比较考察R-DINA模型在模拟数据和实测数据(Tatsuoka分数减法数据)上的诊断性能,并检验作者关于R-DINA模型一定程度上可以作为R-RUM简化模型的假设。研究结果显示(1) R-DINA模型与R-RUM在模拟数据分析与实测数据分析上表现相当。一定程度上,尤其是当项目所测属性的异质性不是太大时,R-DINA模型可以作为R-RUM的一个简化模型。(2)在模型选择不当的情况下(模型资料不拟合的情况下),采用R-DINA模型或R-RUM分析DINA模型数据,较之采用DINA模型分析R-DINA模型或R-RUM数据,其造成的项目参数返真性(尤其是猜测参数)和被试分类准确性下降的后果相对较小。(3)采用三个模型对Tatsuoka的分数减法数据进行分析得到的结果显示,从经验的角度来看,该分数减法测验各项目反应的属性作用机制不是单一的。研究三(论文第五部分):首先根据可逆跳转的马尔可夫链蒙特卡洛(RJMCMC)原理,建立了用于DINA、R-DINA和R-RUM三个模型自动选择的RJMCMC方法,以提高认知诊断模型与属性作用机制的匹配性。接着设计了模拟研究验证了该方法的正确性和可行性,然后采用该方法对Tatsuoka分数减法数据进行了实证分析。模拟研究结果显示:RJMCMC方法估计得到的模型类标返真性、项目参数的返真性较高;知识状态判准率和模型资料拟合结果与事先指定了模型类标的混合MCMC方法的结果相近。实证研究结果发现:从模型资料拟合的结果来看MCMC(DINA)表现较差;MCMC(R-RUM),MCMC(R-DINA)和RJMCMC三者比较接近,相差较小。从数据的角度来看,该分数减法测验各项目上的属性作用机制大多更符合R-RUM和R-DINA模型的认知假设,即正确作答概率与属性掌握个数有关。