论文部分内容阅读
本文研究的重点是基于句子抽取的中文单文档自动文摘的几个关键技术:语义段划分、文摘句选取,最后文章对单文档自动文摘系统的评价进行了探讨。首先,本文对基于自然段相似度计算的语义段划分方法进行了详细的讨论,并与基于TextTiling算法的方法进行了对比;在文摘句选取部分,本文应用了命名实体识别和指代消解技术,在此基础上提出了结合去冗余技术的句子特征加权的文摘句选取方法,并且与基于句子特征加权法、全覆盖法这两种方法进行了对比。本文还利用遗传算法对其中的加权系数进行了优化。此外本文讨论了单文档自动文摘的评价技术。基于四个不同文摘系统生成的文摘,结合人工评价的结果对不同的文摘自动评价方法进行了对比,另外,结合自动评价和人工评价,本文对自动文摘中各种方法和技术应用后所起的作用进行了有效地评估,极大地推动了系统的开发与改进。