认知诊断理论在计算机自适应测试中的应用与启示

来源 :中国远程教育 | 被引量 : 0次 | 上传用户:szRUIZHIZI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】
  随着科学技术的进步,计算机技术正逐步与认知诊断理论结合,形成计算机化自适应认知诊断测验(Computerized Adaptive Test for Cognitive Diagnosis, CD-CAT)的评测方式。用CD-CAT进行教育测量评估有着诸多优势,但是目前国内尚缺乏计算机化自适应认知诊断测验的实验研究与大规模的实践应用。本研究运用内容分析法,以“计算机自适应测试”和“计算机认知诊断测验”为关键词进行搜索,结果表明:国内于2006年开始逐步开展CD-CAT研究,近几年的研究热点主要聚焦在理论概况(占总样本的比例为15%)和现状综述(占总样本的比例为74%)方面,具体内容包括确定属性、认知诊断模型和流程方法,也有小规模的测试实验,如英语、化学等学科。基于此,运用UCINET将“研究者派系”可视化,发现领域科研合作紧密,但是整体合作疏远,小团队研究更加集中。最后,文章介绍了国内外CD-CAT实践案例,阐述了认知诊断评价在教育领域的发展方向和策略,期望对国内教育评价走向CD-CAT有所启发。
  【关键词】 教育评估;认知诊断理论;认知诊断模型;计算机化自适应认知诊断测验
  【中图分类号】 G434 【文献标识码】 B 【文章编号】 1009-458x(2017)04-0042-09
  一、研究背景
  随着计算机技术、通信设备和网络技术的迅速发展,教育信息化的发展面临着重大变革,由数据主导的“大时代”正在走入教育领域,进而渗透到教育发展与改革的战略中。复杂的、数据驱动的个性化教学一般需要提供非线性的教学輔导,以及能够满足学习者个别化、具有差异的认知水平和能力水平的诊断评估。因而,以认知诊断测验为代表的新一代测验理论应运而生,能够解释学生在推理和解决问题过程中所用到的知识和技能,并提供关于学生知识技能掌握情况的诊断信息,同时保证测验的“公平性”,为“因材施教”和“个性化”教学提供可能。
  Mislevy等(1993)指出,统计测验理论的发展可以分为经典测验理论(Classical Test Theory, CTT)阶段、概化理论阶段和项目反应理论(Item Response Theory, IRT)阶段。CTT和IRT 都属于标准测验理论。标准测验理论视所测的心理特质为一个单纯的“统计结构”,目的在于从宏观上给个体一个整体的评估。随着心理测量学和认知心理学的进一步发展和现代教育技术水平的进步,学习者更加渴求获得更具体的、细微水平的测量与诊断评估。Frederiksen、Mislevy和Bejar(1993)编著的Test theory for a new generation of tests正式出版,标志着新一代测量理论的诞生。如图1所示,认知诊断评估逐步走入历史舞台,强调“能力水平”和“认知水平”维度能够被同时诊断,不再仅仅是单一的宏观维度的“知识水平”。计算机化自适应认知诊断测验(Computerized Adaptive Test for Cognitive Diagnosis, CD-CAT)是计算机化自适应测验理论和认知诊断理论相结合的产物,目的是达到“因材施教”“量体裁衣”式的自适应诊断,根据学习者当前状态,选取与之相适应的题目进行测试,进而诊断学习者能力水平和认知水平,以诊断报告的方式为学习者提供提升的建议和策略。
  纵观计算机技术与统计测验的结合,其发展分为两个阶段:其一是以项目反应理论(IRT)为代表的标准计算机自适应测量阶段;其二指新一代测量理论的计算机自适应阶段(认知诊断是其核心内容)。项目反应理论的特点是以概率函数的形式来描述项目作答反映结果是如何受到被试能力水平和项目特征联合作用的影响。自适应测验起源于Alfred Binet(1904)开发的智力测验,根据被试的不同特质水平和题目的不同难度与区分度,对被试实测不同的测验题目,使这些题目与被试的实际水平尽可能相适应,这样使测验更具有针对性,从而每施测一道题就能获得最大的信息量。
  当现代技术手段——计算机引入到测量领域中,计算机化自适应测验(Computerized Adaptive Testing, CAT)由此诞生,由计算机自动从题库中选择合适的题目给学习者作答,一方面能够在学习者做完后自动评估其能力水平,给出适合学习者的下一道题目;另一方面能够自动设定终止规则,即当达到能够评估学习者能力的题目数后,测试会自动停止。之后,运用CAT思想与认知诊断理论结合,从题库中选择最适合学习者水平和最能区分水平能力的题目作答,对其知识状态达到最恰当的评估。CD-CAT更多关注被试掌握模式的自适应,根据可观察的行为和反应,推测潜在的知识结构和技能掌握情况。例如,获得相同分数的学生不能够体现个体差异,如果在测验中能够对学生作答反应、知识反应和能力诊断,从而能够进一步提出补救措施。CD-CAT的流程包括:开始测试—初始题目选择—估计被试当前状态—选题策略—认知诊断计量模型—终止条件—诊断报告。对于CD-CAT的研究目前处于探索开发阶段,组成CD-CAT各个阶段的问题仍需要摸索和实践应用,例如如何确定知识状态和表征能力属性、认知诊断模型的应用研究,如何选择初始题目,以及题库的开发、建设与维护等方面。
  综上所述,为了从整体上把握CD-CAT在国内的发展脉络,厘清发展现状和研究聚焦,提出实施CD-CAT的科研建议和实施策略,分别从以下方面进行分析:一方面,以时间(2005-2015年)为轴,考察关于“认知诊断自适应测试”文献的研究情况,采用内容分析方法对已有百余篇中英文文献进行内容分析,并通过数据的可视化表征和社会网络分析工具,探讨其研究重心和内容;另一方面,通过分析国内外已有CD-CAT平台和项目的实践情况,总结和借鉴国外实施经验,为我国今后的CD-CAT研究提供发展策略。
  二、研究过程   (一) 研究方法与工具
  本研究主要采用文献研究法、内容分析法和数据可视化的方法,通过对有效文献的各类属性进行分析和标识,从而获得不同维度的计量分析结果,即对本质内容进行不同方面、由浅入深、层层递进的非线性分析。研究主要借助软件管理软件NoteExpress、数据处理软件SPSS 20.0和词云生成平台Tagxedo。首先,界定研究内容和范围CD-CAT;然后,团队成员分别对2005-2015年的文章进行筛选,梳理成为研究样本;接着,根据已有文献确定分析维度,以理论概述、现状实践、研究方法等为分析内容,对样本进行统计和处理。
  (二) 数据收集
  采用内容分析法对2005-2015年国内发表的关于自适应认知诊断的文献进行比较、分析、综合,对研究内容和现状进行梳理和总结。为了研究的严谨性和数据分析的准确性,将学术论文与毕业论文分开统计,中文数据库来源有“中国知网”和“万方数据库”,以“认知诊断”和“认知诊断自适应测验”为关键词进行搜索,与教育测量和教育技术领域相关的文献汇总如下:中文学术期刊检索到140篇,学位论文68篇;CSSCI期刊主要集中在《北京师范大学学报(社会科学版)》《教学学报》《心理科学》《心理科学进展》和《心理学探新》等。为了对比中英文文献关于结果分析中初步印象部分的差异,即关注焦点可视化部分,选取以“Computerized Adaptive Test for Cognitive Diagnosis”和“Cognitive Diagnosis”为关键词,在Computers
其他文献
摘 要:《光谱》是三十年诗选,按时间顺序编了三辑,从后向前分别是恰同学少年时的作品,第二部分是二十五到而立之年的部分作品,第三部分是三十到四十五岁左右的部分作品。不同人生历程中,有不同的风景,不同的认知和感悟。诗人的阅历使诗歌内涵显得厚重,同时随着心性的沉淀,对生活的感悟愈发深刻,诗歌也别有风味。这是一本纪念性诗集,其意义就是“检视一下自己诗歌创作的历程和道路,收获和缺失,以及更重要的是,我的生命
摘 要:生在中国哲学中的意义是非同一般的,可以说它是一个核心的地位,有人将这两个的关系进行了描述,认为生命是生的全部内涵,并将其与中国哲学进行融合;也有人在道德层面上进行论证,就笔者而言,两种观点都值得认同,但也存在一些不完善的部分。本文就生与中国哲学的关系进行描述,并总结了生的含义以及内在价值,最后将人和自然的关系与生的哲学进行结合理解。  关键词:中国哲学;生;自然界  [中图分类号]:B2
江南可采莲,  莲叶何田田,  鱼戏莲叶间。  鱼戏莲叶东,  鱼戏莲叶西,  鱼戏莲叶南,  鱼戏莲叶北。
摘 要:通过对“孝”思想的研究与学习,联系“孝”思想在大学校园没有得到很好重视与延伸的现状,阐述修身养性、爱亲敬亲、尊师敬老的重要性。思考大学生应该如何传承“孝”思想,行孝悌,立天下。  关键词:“孝”思想;修身;爱亲敬亲;尊师敬老;行孝悌;立天下  作者简介:陈若茵,女,广东轻工职业技术学院文秘专业2013级学生;程时用,男,副教授。  [中图分类号]:G64 [文献标识码]:A  [文章编号]
“小兄弟”是一位貧穷的年轻画家。一次,在参加贵族才能参加的舞会时,他误穿了不得体的衣服。他该如何化解这场尴尬呢?  1 Little Brother was a young painter. Although he lived in the cheapest house, he always held his head high, spoke to everyone he met and show
我们很少有真正的朋友。  时间最能说明这个问题。所谓“真正的”必然经久不衰,永垂不朽,而事实上,越是你自以为是的友谊,往往不得善终。古人云,君子之交淡如水,小人之交甘若醴,不无道理。我们大多数做不了君子,就干脆做个小人,我们总觉得淡如水的不是友情,只是过场,一定要酒肉相欢,觥筹交错,才能算彼此交心,酒后吐真言,天马行空,说天道地,谈笑风生之后,就是人去楼空,等到某天突然翻起手机,才想起,好像好久没
摘 要:在古镇保护的视角下,将河南省道口古镇作为研究的目标,通过对其现状的调查研究,分析其存在保护状况欠佳,开发力度不足等问题,并据此提出分区保护、发展古镇旅游等多元保护与开发的方案,有利于打开历史文化名镇研究的新思路,促进道口镇全面协调可持续发展,同时为河南其它历史古镇更好的保护与开发提供借鉴,对新型城镇的建设发展有重要的意义。  关键词:道口镇;现状;问题;对策  [中图分类号]:K928 [
摘 要:吉赛贝·托纳多雷是意大利著名导演,他的影片曾多次获得国际重大奖项,《西西里的美丽传说》是他著名的“时光三部曲”之一,影片以雷纳多的视角讲述了玛莲娜的悲惨遭遇,导演发出了对人性的拷问。  关键词:玛莲娜;人性;尊严  作者简介:李楠(1993.6-),女,山西长治人,西北师范大学传媒学院硕士研究生,研究方向:戏剧与影视学。  [中图分类号]:J9 [文献标识码]:A  [文章编号]:1002
摘 要:《聊斋志异.爱奴》写的是教书先生如何受到鬼魂一家人的礼遇,小说体现了在封建教育制度下,蒲松龄作为塾师希望得到人格方面的尊重和理解,而结合蒲松龄真实的塾师经历,我们还能够感受到,无论私塾环境多么优越,蒲松龄依然迫切希望通过科举考试步入仕途,改变寄人篱下的命运。  关键词:蒲松龄;塾師;尊师重教;科举考试  作者简介:许学宁(1979.12-),男,辽宁沈阳人,辽宁大学文艺学专业硕士 就职于沈
摘 要:巴尔扎克是法国批判现实主义的一颗巨星,他的《人间喜剧》更是受到许多人的喜爱,对巴尔扎克本人和他作品的研究已是数不胜数,但其中涉及巴尔扎克宗教情怀的相关研究却是很少见的,在他的《乡村医生》这部小说中,我们透过贝纳西的人生经历,可以看出宗教在巴尔扎克作品中所扮演的角色,进而可以发现巴尔扎克肯定宗教的某些进步作用。  关键词:宗教;巴尔扎克;原罪;救赎;忏悔  作者简介:崔丹丹(1991.12-