G-DINA模型参数估计的比较与应用:HMC和EM算法

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:liuhuimin002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
诊断分类模型(Diagnostic classification models,DCMs)是一类多维的、离散的潜变量模型,在心理和教育领域以及其他多种学科中受到越来越多的关注。根据潜在属性掌握剖面估计方法是否参数化,可将DCMs分为参数化DCMs和非参数化DCMs。有代表性的参数化DCMs是G-DINA(Generalized Deterministic Inputs,Noisy“and”Gate)模型。模型参数估计是DCMs的重要组成部分,模型参数估计的准确性直接影响被试潜在属性掌握剖面的估计。目前DCMs模型参数估计中所广泛应用的估计方法为EM算法(Expectation-Maximization Algorithm)和贝叶斯分析方法,马尔科夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)算法是贝叶斯方法的代表。哈密顿蒙特卡洛(Hamiltonian Monte Carlo,HMC)算法是MCMC算法的一种形式。相关研究表明,HMC算法对于统计模型参数估计是有效的,特别是对于参数较多、估计过程较为复杂的模型。Stan是一个建立在HMC算法基础上的软件程序,已被引入心理测量模型作为模型参数估计的一种软件。本文开发基于Stan程序的同一链接(identity link)函数下的G-DINA模型估计代码,即使用Stan对同一链接函数的G-DINA模型进行模型参数估计。结合以往研究的发现和不足,探索EM算法和HMC算法在估计G-DINA模型参数时的差异。具体而言,本文比较了CDM包、GDINA包和Stan在模拟研究以及实证数据分析中的差异。自编小学小数除法认知诊断测验,并以此为例重点探究不同的模型参数估计方法或程序在实际应用中的效果。研究一是在G-DINA模型的基础上生成模拟数据进行模拟研究,评估CDM包、GDINA包和Stan在模拟数据中模型参数估计的稳定性与准确性的表现。发现:(1)在本文设定的两种样本量条件下,EM算法估计截距参数和主效应参数的准确性优于HMC算法,但在样本量为2000时,HMC算法估计交互效应参数的准确性要好于EM算法。(2)在样本量为2000时,HMC算法的估计稳定性要优于EM算法。(3)在两种样本量条件下,EM算法和HMC算法估计模型参数的准确性在项目参数种类上的表现为对截距参数的估计准确性最好,其次是主效应参数。研究二是小学小数除法认知诊断测验的编制和经典测量理论(Classic Test Theory,CTT)分析,目的在于构建小学生小数除法的认知诊断测量工具。本研究以“小学五年级小数除法”章节为例,编制了认知诊断测验。在山东省济宁地区的几所小学进行正式测验,题目数量为30。确定了四个认知属性包括(A1)乘法表逆运算、(A2)试商规则、(A3)商不变规则和(A4)除法运算规则。结果表明,认知诊断测验具有良好的信度和内容效度,各项指标均符合计量学要求。CTT只能得出被试在样本总体分布中的相对水平,因此设计研究三通过Stan、CDM包和GDINA包来进行CDT(Cognitive Diagnosis Theory,CDT)分析,以此获得被试对小数除法认知属性的掌握情况和小数除法认知属性的总体掌握情况。研究三的结果表明:(1)Stan估计的交互效应参数均为负值,但CDM包和GDINA包估计的交互效应参数有部分为正值。(2)有部分题目的截距参数较高,这些项目与研究二中难度较高的项目高度重合。(3)部分结构参数的估计值在Stan、CDM包和GDINA包的估计结果中较小且接近0,证明小数除法的认知属性中可能存在属性层级关系。(4)根据结构参数估计值,潜在属性掌握剖面占比最多的为全掌握(1111)和全未掌握(0000),说明小数除法的各个知识点之间的联系紧密。综上,(1)本研究编写的Stan代码可以实现HMC算法对同一链接(identity link)函数下的G-DINA模型中的参数的有效估计;(2)小数除法认知诊断测验作为有效的测量工具,能够为小数除法的认知属性诊断提供帮助。
其他文献
归属需要是个体形成和维持最少数量的非负性人际关系的需要,当个体认为自己与另一个人的关系具有很高的价值时,他们会体验到接受感并满足其归属需要,而当个体认为自己与另一个人的关系毫无价值时,就会体验到拒绝感并使其归属需要受挫。以往研究表明,归属需要与错失恐惧和社交媒体使用强度密切相关,并对社会拒绝反应有着重要影响。本研究在前人研究的基础上,运用横断研究在大学生群体中探讨归属需要对社会拒绝反应的影响,考察
学位
创造性被定义为个体产生新颖且适宜的想法或产品的能力。元控制被定义为监控和调节认知控制的能力,是一种更高层次的控制。创造性思维受到元控制状态的调节。发散性思维更多地受益于一种较弱的目标影响和较弱的局部竞争,使得个体可以轻松快速地从一个想法跳跃到另一个想法,更多地涉及灵活性。相反地,聚合性思维更多地受益于较强的目标影响和更明显的局部竞争,需要更多的坚持性。因此,根据目标导向适应性地调整坚持性和灵活性的
学位
进入初中阶段,初中生不仅要面对课程门类增多、课程难度加大的新变化,也面临着普通高中招考的剧烈竞争,特别是与小学时期相比,初中生的学业成绩呈现快速分化趋势,诸多学习情境因素的巨变容易导致部分初中生产生不利于自我发展的负性学业情绪,甚至产生严重的羞愧感,影响其以后对学校学习生活的体验——这一问题已引起许多研究者的高度关注。以往对学业情绪和学业效能感的关系以探讨两者之间中介的研究较多,但是没有涉及学业控
学位
随着我国经济实力的不断增强,海外回流人才数量不断增加,尤其近年来海外人才回流进入高峰期。江苏省作为人才回流大省,在海外人才的就业创业服务方面起步较早,并一直将海外人才的就业创业服务作为促进就业的重要举措,从领导体系构建、政策制度完善、载体平台建设、公共服务效能、品牌项目多样化等方面予以全方位支持,取得了一定的成效。但是经过与相关部门的座谈交流,以及与海外人才流入量排名前三的北京市、上海市、广东省相
期刊
儿童情绪调节能力是对自身情绪的发生及内在体验的觉察,从而适时表达自身情绪并对外界产生作用的能动反映。儿童情绪调节能力对促进儿童身心健康发挥至关重要的作用,发展过程受到多种因素影响,而父母养育是其直接影响因素。以往研究多通过对父母养育方式加以改善来促进儿童情绪调节能力的发展,但在实际育儿实践中受养育方式的稳定性且难操作的影响,效果并不理想。父母养育心理灵活是父母在养育孩子的过程中,接纳自己对孩子的负
学位
国际传播工作对于让世界了解中国和为中国赢得良好的国际舆论环境而言,其重要性毋庸置疑。长期以来,主流语境中使用较多的是对外宣传(与外宣对应的是内宣),后较多使用国际传播的提法,也仍然使用对外传播的概念。概念使用的转换和变更,并没有改变事情的本质,但反映了传播理念和传播手段的某些重要变化。在这一方面,中国共产党随时代发展对舆论思想进行了重要调整。在新民主主义革命时期、社会主义革命和建设时期、改革开放和
期刊
词汇附带习得是在非以识记词汇为目标的语言活动中,学习者无意识进行的词汇习得,包括词汇的词形、意义和用法。本研究尝试将读写任务与词汇学习相结合,探究三种读写任务(读后续写、概要写作、读后相同主题写作)对高中学生词汇附带习得的影响,以期为高中英语教师的词汇教学提供一定的实践参照。本研究为期4周,以山东省某市高中一年级三个实验班共153名学生为实验对象,其中A班进行读后续写、B班进行概要写作、C班进行读
学位
择偶作为一种重要的社会、心理以及文化现象,一直以来是社会学、经济学及心理学等领域中重要的研究课题。在心理学领域,研究者大多基于进化论等理论视角探究性别、外貌吸引力以及社会经济地位等心理、生理以及社会因素对个体择偶偏好的影响,却缺乏关注文化因素对个体择偶偏好的影响。在中国文化背景下,传统的属相、八字合婚信俗在现实中仍影响着人们的择偶偏好,而这一现象背后的原因及其心理机制却鲜有研究者进行探讨。基于此,
学位
语言认知加工主要涉及语言理解和语言产生,不仅包含语言特异性因素如语义、音韵和正字法的加工,还涉及一般领域的认知能力如加工速度、执行功能、归纳推理等。随着年龄增长,控制高级认知功能的大脑前额叶皮质最先衰退,出现认知年老化现象,语言理解和产生能力也出现不同程度的衰减。研究表明,执行功能具有可塑性,经过认知训练,注意、工作记忆等能力可以得到提高。以往研究大多关注一般领域的认知加工,少有研究考察训练效应能
学位
本次翻译实践所选文本是金伯利·尼古拉斯博士(Dr.Kimberly Nicholas)所著的《同一片天空下:人类如何应对全球变暖》(Under the Sky We Make:How to Be Human in a Warming World)的第五章和第十一章。该部分从生态恶化的原因出发,揭示个人行为对生态环境的影响,其意义是让读者相信个人的能力和价值,从而促进社会和文化的真正改变。《同一片天
学位