【摘 要】
:
作文自动评分系统是应用计算机技术对英文作文进行评分的系统。作文自动评分系统综合应用了统计学、自然语言处理、语言学及信息检索等领域的技术。目前国外作文评分系统(如E
论文部分内容阅读
作文自动评分系统是应用计算机技术对英文作文进行评分的系统。作文自动评分系统综合应用了统计学、自然语言处理、语言学及信息检索等领域的技术。目前国外作文评分系统(如E-rater)都得到了广泛运用。但是目前国内学者对英语作文自动评分系统的研究仍然处于初始阶段。随着在线教育的兴起,学生对知识掌握程度的衡量也需要自动化评测工具的帮助,因为传统的人工批改方式不再适用于拥有大量学生的在线教育。相比于人工评分,作文自动评分系统的评分更加快速,更加公正,更加经济。本文首先基于EDX平台的开源项目研发了基础的作文评分系统。该系统将作文评分过程看作是文本分类过程,采用的分类器是梯度提升决策树分类器。但这个评分系统并不完美,一方面系统特征不能充分反映作文特征,另一方面可扩展性不好,为了添加新的作文题目,需要新的训练集和测试集来重新训练评分模型。国外优秀的作文自动评分系统综合考虑了作文的语法表达、语义内容和篇章结构等评分因素。语法错误数量是衡量语法表达好坏的重要标准,所以论文将作文语法错误检测作为研究重点。本文随后研究了基于语言模型的语法检测方法。在该系统中,用SRILM工具搭建语言模型服务器。语言模型服务器可以用来查询N-gram词组的概率。根据单词词干为单词生成候选集,然后根据维特比算法求取最优词汇组合。若该词汇组合与原始句子不同,则认为检测出语法错误。但该方法也有缺陷,只能检测出替换类型错误,而无法检测出插入型错误和删除型错误。本文还研究了冠词和介词错误检测,这两种错误是英语学习者最常犯的语法错误。模型训练集提取自大不列颠国家语料库。因为该语料库可以认为是没有语法错误的,所以初始训练过程无任何错误样本。为了使训练样本更接近英语学习者语言表达,本文在训练过程中添加了人工制造的错误样本,从而引入错误语法信息,提高了分类器对错误信息的敏感度。本文将语法错误检测过程视作分类任务,选取的分类器是对稀疏特征有着强大分类能力的最大熵分类器。从实验结果来看,冠词和介词错误检测系统性取得了与国外大学研究成果相当的结果。论文最后展望了以后的研究重点:语义分析与更多种类的语法错误检测。
其他文献
全球卫星导航系统(Global Navigation Satellite System,GNSS)包括GPS系统、伽利略(Galileo)系统、格洛纳斯(GLONASS)系统以及北斗卫星导航系统。2012年底,北斗卫星导航系统
可靠性及链路故障自愈能力是电信级以太网需要解决的首要问题,传统的保护机制如生成树协议难以满足电信运营商对实时业务完善的要求,特别是50ms的网络故障自愈能力。对于传统以
摘要:社会经济的飞速发展和城市化建设进程的不断加快,极大地推动了高速公路建设事业的发展,混凝土施工技术的引入,为当前我国高速公路桥梁建设事业的发展提供的基础和保障。本文将对当前高速公路桥梁施工中的混凝土裂缝原因进行分析,并在此基础上提出一些建设性建议,以期为我国高速公路桥梁建设事业的发展做出一点贡献。 关键词:高速公路;桥梁施工;混凝土裂缝;研究 中图分类号:U412.36+6 文献标识码:A
摘要: 工程质量监理是依据合同条款、技术规范和设计文件对工程施工中各个环节、工序进行严格的、系统的和全面的监督管理,以保证工程质量达到合同规定的要求,在桥梁工程监理中,工作的中心是抓住各道工序检查,严格执行工序质量管理程序,确保每道工序的工程质量达到合同规定的标准和等级要求。文章通过对钢筋混凝土桥梁工程施工过程监理的分析,总结了公路桥梁施工监理工作经验,并提出了不同观点和建议。 关键词:桥梁工程
软件无线电(SDR)是20世纪90年代以后逐渐兴起的一种全新的设计思想,其核心思想就是在通用的通信硬件平台上加载不同的通信软件,以实现不同的通信方式间的切换。这种全新的设
摘要:施工现场安全生产管理是施工企业和工程项目部组织安全生产的全部管理活动,通过控制生产要素和社会要素的具体状态,不断减少直至消除施工中的不安全行为和危险状态,杜绝事故,尤其是杜绝使人受到伤害的事故,保障项目顺利完成以及经济效益的实现。本文探讨了建筑工程施工安全事故产生的原因与改善措施。 关键词:建筑工程;施工;安全事故;原因;措施 中图分类号:P624.8 文献标识码:A 文章编号: 建筑
摘要:深基坑开挖不仅要保证基坑的稳定,还要满足变形控制的要求,以确保基坑周围建筑物、构筑物、地下管线和道路等的安全。本文以圣奥中央商务大厦深基坑工程为例,介绍了监理工程师如何在复杂地质情况下做好基坑验算、开挖及支护控制检查工作,希望能够给监理工程师审核危险性专项施工方案提供一些参考。 关键词:深基坑,基坑验算,支护方案,监理控制 中图分类号:TV551.4 文献标识码:A 文章编号: 随
随着多媒体业务访问量的与日俱增以及各种具有互联网接入功能的小型无线终端设备的迅猛发展,宽带无线接入(Broadband Wireless Access: BWA)技术的发展与应用已成为未来的一
云制造(Cloud Manufacturing,CMfg)是一种采用新兴的信息技术如云计算、物联网、服务化、高性能计算等旨在将制造资源和制造能力虚拟成服务,给分布在不同位置的云端用户提供
人体生物特征识别技术是21世纪最有发展潜力的技术之一。通过人体生物特征识别技术进行身份识别克服了传统识别方式容易被窃取、伪造或者丢失、遗忘等缺点,使得该技术广泛地