论文部分内容阅读
英语作文体现了英语的书写能力,是英语能力中的重要一部分,在作文的学习过程中,需要进行大量的写作练习,而产生的大量练习作文同英语老师数量相对较少形成了矛盾,很多练习作文由于无法得到及时的批阅而使得英语学习效果减弱。为此利用计算机辅助进行作文批阅显得非常必要。语法检查是作文批阅中的重要部分,在此之前,王全斌就基于N元语法的语法检查系统做了如下工作:对N元语法模型的调研,对系统的实现流程和基础算法的设计、对语料库的训练和对系统的实现以及对语法检查效果的验证,该系统只是实现了单词的二元语法检查,而且检查算法较为简单。本文的目标是在已有的基础上对基于N元语法的语法检查系统进行改进。为了能够进一步提高N元语法检查系统的检查效果,本文对N元语法模型和语法检查的算法做了进一步的研究,并在原系统的基础上从以下三个方面对原系统进行了改进:1.在训练阶段添加了对词性标注的N元语法训练;2.对训练后的数据进行了平滑处理;3.优化了语法检查算法,添加了对单词的三元语法以及词性标注的二元至五元语法的检查,并优化了判错机制。本文的工作主要是对训练系统和检查系统两大模块进行改进和实现。其中训练系统的改进和实现包括了语料库的选择、训练算法的改进和实现、数据库的表和字段的重新设计、核心类的改进和实现。检查系统的改进和实现包括了核心算法的改进和实现、核心类的改进和实现。在系统实现之后,本文以CLEC语料库为基础对系统的准确率和召回率进行了验证,实验的结果表明系统的准确度提高了2%,而系统的召回率提高了10%。较之前的系统整体效果提升明显。