英语文本语法错误自动纠正模型的研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:apple2008zxffxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会在高速发展的同时伴随着信息数据的爆炸式增长,在信息传递的过程中,语言是极为重要的载体。在所有种类的交流语言中,英语始终占据着重要的地位,是社会生活中最为常用的语言之一,因此英语教育的现实意义不言而喻。随着互联网的全面普及,英语教学早已不再依赖教师的板书,考试方式也逐渐过渡到全面无纸化。借助自然语言处理中的技术手段,设计一种英语文本语法错误自动纠正模型可以大幅减少教师在作文批改上的工作量,辅助教师提升教学质量,对学生而言也能及时得到错误反馈,提高英语学习的效率。另外,相比于人工批阅作文,利用语法纠错模型对英语作文进行批阅消除了教师批阅的主观因素,评判标准完全统一,批改结果更加客观。本研究以中国英语学习者写作的英语作文等英语文本为对象,研究并设计了一种英语文本语法错误自动纠正模型。本模型能够自动纠正学生作文中存在的绝大部分语法错误,同时能够给出更加通顺的表达方式,可以较为客观的反映学生的写作水平。本研究的主要工作内容如下:1.研究并设计了一种参照长距离上下文信息的语法错误自动纠正模型,该模型以编码器-解码器结构为基础,采用了双编码器结构,通过Transformer编码器来提取句子的上下文信息,通过Bi-GRU编码器提取源句的信息,在解码器端通过门控结构对输入信息进行整合,各部分搭配不同的注意力机制实现适配,提高了模型对句子中相关特征的提取和分析能力。实验表明,本模型的语法纠错的精确率达到了81.08%。2.提出了一种基于流利度的数据扩增方法,结合本文的模型能够较好地模拟生成中国英语学习者在写作中的不流畅句子,并与表达流畅的句子组成平行句对,通过调整目标句与源句的流利度比值可以选取不同流利程度的句子,能够较好的适应不同纠错系统的性能,具有一定的普适性。同时相比于使用统计模型获得的错误句子,该模型生成的句子中包含了更多中国学生常犯的语法错误,更具有针对性。3.设计并实现了一种动态集束搜索的解码方法,该方法在集束搜索方法的基础上,结合核采样技术实现对解码器输出的动态抽取,并加入惩罚因子来降低产生重复单词概率,同时抑制模型偏向生成较短的句子。
其他文献
本文通过电弧熔炼与甩带的方法制备出了具有密排六方结构的稀土高熵合金Gd Tb Ho Er、GdTbHoErY、Gd Tb Ho Er La、Gd Tb Ho Er Pr和Gd Tb Ho Er La Y。主要对这些高熵合金做了三个方面的工作:一、通过XRD、SEM和TEM证明了稀土高熵合金GdTbHoErY具有单相的密排六方结构,并且绘制了其磁性相图,研究了其相变类型和磁热效应。二、在稀土高熵合金
空天地海一体化是未来通信发展的重要战略,水下通信作为其中重要的一环,引起了各个国家的极大兴趣。水下无线通信技术主要分为三种:微波通信、水声通信和水下光通信。水下无线光通信具有大带宽、抗干扰能力强、保密性好、体积小等特点,在军事和宽带接入网等领域具有很大的应用潜力。实际的水下无线光通信链路中,海水对光具有吸收、散射等衰减特性,且对于光的影响随波长改变,例如海水中存在蓝绿光谱透射窗(450~550nm
MOSFET功率器件具有驱动方式简单、易集成、易并联、输入阻抗高以及开关响应快等优点,广泛应用在交通运输、生活娱乐以及军事航空等各个领域。但是由于其比导通电阻(Ron,sp)与击穿电压(BV)存在着2.5次方的矛盾关系,于是随着击穿电压的升高,导通电阻显著增加,这严重的限制了MOSFET在高压大功率领域的应用。本文围绕如何改善横向MOSFET功率器件中Ron,sp与BV的矛盾关系,以及如何降低曲率
在建筑密集的城市、深林沟壑的野外和室内等环境复杂的区域,全球卫星导航系统(Global Navigation Satellite System,GNSS)信号容易受到遮蔽,导致定位精度下降严重,甚至无法提供正确的位置服务。为此,在特定区域建立伪卫星定位系统来提供导航信号能够有效弥补卫星导航系统的信号盲区,成为克服此类问题的途径之一。在分布式伪卫星独立组网定位系统中,伪卫星的时钟各自独立,因其工作起
大数据时代对传统存储系统的各项性能提出了全新的挑战,传统存储系统在大规模数据存储方面存在诸多缺陷,所以分布式存储系统凭借其优秀的性能和低廉的构造成本成为了当前大规模数据存储领域的主流存储系统。但由于分布式存储系统的底层设备普遍采用廉价商用硬件,故障率较高,因此,如何在节点失效成为一种常见问题的场景下保证存储数据的完整性与可靠性成为了首要问题。为了防止由节点故障导致的数据失效所引起的业务损失,分布式
随着网上信息量的急剧增加,信息过载问题成为了制约网络发展的一个重要因素。个性化推荐系统作为解决信息过载问题的有效手段,得到了工业界和学术界越来越多地关注和研究。图作为一种重要的数据结构,可以表示一组对象及其之间的复杂关系。随着人工智能的发展,可以有效提取图中特征表示的图神经网络被提出,并在生物化学、经济金融等领域取得了显著的研究成果。推荐系统中的大部分数据本质上具有图结构,将图神经网络应用于推荐系
针对在噪声、混响等环境下语音识别系统识别率严重下降的问题,本文以深度学习和麦克风阵列信号处理作为主要技术方法,讨论并研究了若干鲁棒语音识别中的关键技术。论文的主要工作与贡献如下:(1)搭建了一个基于混合声学模型的语音识别系统,通过实验,研究了三音素上下文建模、深度神经网络、特征变换技术对识别率所带来的影响,并且评估了这些技术在混响噪声环境下的鲁棒性;(2)在流式语音识别的实际应用中,通常要求系统的
随着互联网技术的应用,在线教育领域得到迅速的发展,人们获取知识的途径也变得更加便利。网上用户可以灵活地通过在线学习平台上获取学习资源,并进行在线课程学习。在大数据时代,随着在线学习用户人数不断地增多,学习者在面对海量学习资源的数据时,需要花费较多时间和精力去筛选课程的相关内容。而推荐系统是能够处理这些“信息过载”问题的有用方法之一,能够为学习者提供个性化在线学习资源课程推荐服务。尽管推荐算法在其他
随着我国锚杆支护理论和设计方法的不断完善,新的支护材料和支护器材不断研制成功并投入使用,在基础设施建设如边坡、堤坝等方面发挥着重要作用,应用也越来越广泛。但在锚杆使用过程中,由于实际工程难免受到各种复杂环境的影响,对工程的质量把控比较困难,从而可能导致工程质量问题的发生。在大量使用锚杆的情况下,锚杆锚固的施工是否起到了加固作用不仅影响着设施工程的整体质量,也影响着人民的生命和财产安全,因此对于锚杆
知识追踪是教育数据挖掘领域中一个重要的任务,其主要内容是根据学生的历史做题序列对学生的知识点掌握情况进行建模,从而预测学生的学习表现。在智能辅导系统中,一个非常重要的任务是了解学生的知识点掌握情况,只有了解每个学生的具体情况后才使得针对性、个性化的辅导成为可能。智能辅导系统通过知识追踪可以获取学生的当前表现,随后可通过个性化习题推荐等功能来提高学生的学习表现,因此研究知识追踪任务具有重要的意义。知