论文部分内容阅读
现有的中文自动校对方法使用字、词或词类的n元语言模型。它们的问题在:仅使用某种局部语言现象的统计特征,导致处理能力足,多种语言模型没有合一。该文设计实现了一个基于特征的中文自动校对方法。该方法综合考虑了中文文本中字词和词局部语言特征以及长距离的语义特征,并且采用Winnow方法进行特征学习。评估实验表明该方法召回率达到85℅,准确率达到41℅,订正率达到51℅。性能比目前常用的词的N元模型方法有明显的提高。