论文部分内容阅读
在大规模被试评价中,任务完成的准确率一直是评价的主要指标。然而,在各种任务情景中,反映执行者素质的指标除了结果的正确性之外,决策过程的时效性同样是极其重要的。因此,结果的准确性和反应的时效性,都应该作为评价被试完成任务质量的两个不可或缺的指标。在被试解决任务过程中,既需要评价其完成任务的准确性,又需要评价其完成任务的时效性。但是,被试在任务解决过程中,不可避免地需要权衡结果的准确性与过程的时效性,也就是速度与准确率权衡。被试在作答过程中,项目作答反应时的快慢选择不同,必然会对准确率产生不同的影响。
在现有的反应时与准确率的分析中,最常用的是van der Linden(2007)提出的分层模型。但是,分层模型仅通过速度和能力的关系来反映反应时与准确率的权衡关系是不够的,而且分层模型是建立在被试未知的权衡状态上。因此,有的研究者从协方差角度,在项目水平或者项目与被试交互水平上进一步解释作答反应时与准确率关系,但是却无法反映作答反应时对准确率的动态影响。之后,研究者以残差反应时作为协变量引入反应模型中,却过度扩大了反应时对准确率的影响。在认知实验中,对速度与准确率进行大量的实验研究,并检验了SAT模型的有效性。因此本文以认知实验SAT模型为基础,对分层模型进一步扩展,使其既能反映反应时对准确率的动态影响,又不夸大反应时对准确率的作用,从而构建了新的考虑速度与准确率权衡的分层模型。
本文主要围绕速度与准确率权衡,从被试权衡评价到新的速度与准确率权衡分层模型构建,展开了四项研究:
(1)研究一,从权衡指标角度对被试在任务加工中的速度与准确率及其权衡问题进行分析。结果发现项目时间强度指标、被试速度水平指标与对数正态反应时模型的项目时间强度参数、被试参数分别呈现高相关。同时,被试在作答过程中存在不同的权衡特征,可以将被试粗略的划分为又好又快、好却慢、又慢又差、快却差四种权衡类型。
(2)研究二,基于认知心理学实验的SAT模型,通过理论逻辑分析,构建了一个心理测量学的SAT模型。通过模拟研究发现,心理测量学SAT模型的参数能非常稳定且又精确地被估计。在实际数据上,模型中的变量及其关系也能够很好地得到支持。最后,将心理测量学的SAT模型从项目与整体水平对被试权衡进行评价。
(3)研究三,从混合模型角度整合了SAT模型、IRT模型与反应时模型,构建了一个考虑作答反应时与准确率关系的单调SAT分层模型。在单调SAT分层模型中,通过SAT模型可以反映反应时与准确率的动态权衡关系。当作答反应时充足时,单调SAT分层模型又可以退化为传统分层模型。在模拟数据上,单调SAT分层模型的参数能够得到较好的估计。在实际数据拟合上,单调SAT分层模型相对反应调节模型与传统分层模型都表现出明显的拟合优势;同时残差反应时的区分度的正负值与项目难度有关。
(4)研究四,作答反应时与准确率关系更可能符合非单调关系,当采用单调关系进行解释时,会丧失反应时与准确率的关系的部分信息;并且反应时和准确率关系受到项目难度的影响。基于此,本研究基于速度水平,能力水平和补偿水平三个角度,将单调SAT分层模型扩展为非单调SAT分层模型。非单调SAT分层模型既能够包含反应时与准确率的单调关系,又包含两者的非单调关系。通过模拟数据发现,非单调SAT分层模型参数能被较好的估计。在实际数据上,相对传统分层模型,三个非单调SAT分层模型拟合更有优势;同时,在三个非单调SAT分层模型内部比较上,反应时与准确率的非单调关系更可能受到被试能力的影响。
在现有的反应时与准确率的分析中,最常用的是van der Linden(2007)提出的分层模型。但是,分层模型仅通过速度和能力的关系来反映反应时与准确率的权衡关系是不够的,而且分层模型是建立在被试未知的权衡状态上。因此,有的研究者从协方差角度,在项目水平或者项目与被试交互水平上进一步解释作答反应时与准确率关系,但是却无法反映作答反应时对准确率的动态影响。之后,研究者以残差反应时作为协变量引入反应模型中,却过度扩大了反应时对准确率的影响。在认知实验中,对速度与准确率进行大量的实验研究,并检验了SAT模型的有效性。因此本文以认知实验SAT模型为基础,对分层模型进一步扩展,使其既能反映反应时对准确率的动态影响,又不夸大反应时对准确率的作用,从而构建了新的考虑速度与准确率权衡的分层模型。
本文主要围绕速度与准确率权衡,从被试权衡评价到新的速度与准确率权衡分层模型构建,展开了四项研究:
(1)研究一,从权衡指标角度对被试在任务加工中的速度与准确率及其权衡问题进行分析。结果发现项目时间强度指标、被试速度水平指标与对数正态反应时模型的项目时间强度参数、被试参数分别呈现高相关。同时,被试在作答过程中存在不同的权衡特征,可以将被试粗略的划分为又好又快、好却慢、又慢又差、快却差四种权衡类型。
(2)研究二,基于认知心理学实验的SAT模型,通过理论逻辑分析,构建了一个心理测量学的SAT模型。通过模拟研究发现,心理测量学SAT模型的参数能非常稳定且又精确地被估计。在实际数据上,模型中的变量及其关系也能够很好地得到支持。最后,将心理测量学的SAT模型从项目与整体水平对被试权衡进行评价。
(3)研究三,从混合模型角度整合了SAT模型、IRT模型与反应时模型,构建了一个考虑作答反应时与准确率关系的单调SAT分层模型。在单调SAT分层模型中,通过SAT模型可以反映反应时与准确率的动态权衡关系。当作答反应时充足时,单调SAT分层模型又可以退化为传统分层模型。在模拟数据上,单调SAT分层模型的参数能够得到较好的估计。在实际数据拟合上,单调SAT分层模型相对反应调节模型与传统分层模型都表现出明显的拟合优势;同时残差反应时的区分度的正负值与项目难度有关。
(4)研究四,作答反应时与准确率关系更可能符合非单调关系,当采用单调关系进行解释时,会丧失反应时与准确率的关系的部分信息;并且反应时和准确率关系受到项目难度的影响。基于此,本研究基于速度水平,能力水平和补偿水平三个角度,将单调SAT分层模型扩展为非单调SAT分层模型。非单调SAT分层模型既能够包含反应时与准确率的单调关系,又包含两者的非单调关系。通过模拟数据发现,非单调SAT分层模型参数能被较好的估计。在实际数据上,相对传统分层模型,三个非单调SAT分层模型拟合更有优势;同时,在三个非单调SAT分层模型内部比较上,反应时与准确率的非单调关系更可能受到被试能力的影响。