主观题自动阅卷中评分模型的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:szshm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主观文字试题是当前中文在线考试系统进行考核的重要内容之一。如何利用计算机对主观文字试题(以下简称“主观题”)进行阅卷与评判一直是考试系统自动化要解决的关键问题,也是自然语言处理领域中一个热点。主观题阅卷技术的研究是信息处理领域的一个重要课题,旨在减轻评判人在考试中的工作量以及保证考试的公平性。 由于主观题答案的不唯一性,目前对在线考试系统的自动化判改一般集中在对客观性试题的处理上;而对主观类试题的自动判改的实现,国内外虽进行了一定研究,但一般是针对英文或在某特定领域内的处理,有一定局限性。基于中文的主观题阅卷涉及到自然语言理解、人工智能、模式匹配等诸多领域的深入研究,实现上较为复杂,到目前为止,研究成果仍较少,且未有成熟的系统,而且大多数系统的基本评阅思路相似,方式比较单一。 为避免人工阅卷产生的个体偏差,减少阅卷过程中主观因素的影响,同时提高大规模考试系统的阅卷速度,本文对主观题阅卷系统涉及的相关技术进行了深入研究。在深入分析整个领域研究的发展特点及趋势的基础上,提出了一种新的针对中文主观题自动阅卷的评分模型。该模型利用文本分类技术来解决自动阅卷问题。模型中利用决策树分类算法进行文本分类,在提取文本特征时注重自然语言处理技术特别是文本语义相似度计算技术的应用,提取学生答案与标准答案的相似程度特征,同时还采用了统计学方法以综合考虑文本的其他特征,最终根据这些文本特征得出待评阅文本的分值。在该评分模型的基础上实现了主观题自动阅卷的原型系统,并在实验分析过程中,通过与人工及对比系统的阅卷结果进行比较分析,证明了系统的客观性、有效性,符合人工阅卷处理过程。
其他文献
近年来,我国钢铁工业迅速发展,作为各种建筑必需品的钢筋是钢铁企业生产的主要产品。在我国,对整捆钢筋的计数与复核计数主要依靠人工进行操作,人工计数虽然对技术没有过高的要求
随着信息与网络技术的发展,各类网络信息系统之间迫切需要有效的数据交互,数据集成已经成为信息共享的关键。由于各信息系统采用的数据模型是互不相同,存在异构性,在语义上没
嵌入式系统因其体积小,速度快,携带方便等特点而越来越被广泛采用,尤其是在掌上电脑、PDA、手机、导航设备等领域更是备受重视。同时随着蓝牙技术的不断成熟,越来越多蓝牙芯片出
随着网络安全问题的日益严峻,入侵检测系统凭借其自身特点有效地弥补了传统安全保护措施的不足,已成为计算机与网络安全的重要组成部分。规则匹配是基于特征匹配的入侵检测系
数据挖掘(Data Mining)又称知识发现,是一个从大规模数据库的数据中抽取有效的、隐含的、未知的、有潜在使用价值的过程,它是当今众多学科领域,特别是数据库领域最前沿的研究
学位
时滞是物质和能量运动过程中固有的特性,而且一个系统中的时滞并不唯一,因此多重时滞现象是极其普遍的。多重时滞的存在使得系统的分析和综合变得更加复杂和困难,同时,多重时
1999年,全球大约有80万人死于道路交通事故,经济损失超过5180亿美元,约占当年全球国民生产总值的1.7%,在此背景下,智能交通系统(Intelligent Transportation Systems, ITS)被
异步电机因其结构简单、质量较小、运行可靠和维护方便等特点,在家用电器和工业领域得到了广泛的应用。对电机各项性能指标的优化成为多年来研究的一项重要课题。电机的优化设
随着数字家庭技术和产业的不断发展,以数字电视为中心的交互服务逐渐成为家庭信息化发展的趋势,但是用户调查结果表明,用户对数字电视满意度普遍不高,一个重要的原因就是数字电视
SoC验证是SoC研制成败的关键,对于设计如何有效地进行验证,一直处于研究之中。本论文以系统芯片SoC的研制为背景,研究SoC设计中的基于WinCE操作系统的软硬件协同验证,具体完成的