基于N-gram语法检查系统的改进和实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zzs0901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语作文体现了英语的书写能力,是英语能力中的重要一部分,在作文的学习过程中,需要进行大量的写作练习,而产生的大量练习作文同英语老师数量相对较少形成了矛盾,很多练习作文由于无法得到及时的批阅而使得英语学习效果减弱。为此利用计算机辅助进行作文批阅显得非常必要。语法检查是作文批阅中的重要部分,在此之前,王全斌就基于N元语法的语法检查系统做了如下工作:对N元语法模型的调研,对系统的实现流程和基础算法的设计、对语料库的训练和对系统的实现以及对语法检查效果的验证,该系统只是实现了单词的二元语法检查,而且检查算法较为简单。本文的目标是在已有的基础上对基于N元语法的语法检查系统进行改进。为了能够进一步提高N元语法检查系统的检查效果,本文对N元语法模型和语法检查的算法做了进一步的研究,并在原系统的基础上从以下三个方面对原系统进行了改进:1.在训练阶段添加了对词性标注的N元语法训练;2.对训练后的数据进行了平滑处理;3.优化了语法检查算法,添加了对单词的三元语法以及词性标注的二元至五元语法的检查,并优化了判错机制。本文的工作主要是对训练系统和检查系统两大模块进行改进和实现。其中训练系统的改进和实现包括了语料库的选择、训练算法的改进和实现、数据库的表和字段的重新设计、核心类的改进和实现。检查系统的改进和实现包括了核心算法的改进和实现、核心类的改进和实现。在系统实现之后,本文以CLEC语料库为基础对系统的准确率和召回率进行了验证,实验的结果表明系统的准确度提高了2%,而系统的召回率提高了10%。较之前的系统整体效果提升明显。
其他文献
人类进入上世纪五十年代后,世界一体化和经济全球化趋势初现。与此同时,译论的研究范畴发生了巨大的变化,学者从最初的语符转换的探讨向充分考虑文化因素方向转变。各国家在各自
传统的塑壳断路器大电流壳架转轴采用铆接工艺,该工艺存在转轴变形,松动等缺陷,影响产品质量。为了解决以上问题,设计了"V"形卡箍螺钉紧固的转轴新结构,新转轴具有工艺简单、
英语和汉语心理词库构建中的音形义联结不同。汉字为表意文字,在汉字习得中,形—义联系紧密,语音加工相对薄弱,因而在心理词库构建中形成牢固的形—义联结和相对脆弱音形义联
传染病数学模型作为公共卫生决策的辅助工具,为应对传染病的挑战提供了重要帮助。人类接触模式作为传染病数学模型的重要组成部分,驱动着传染病在广泛人群中的传播。因此,研