论文部分内容阅读
文本蕴涵是文本理解与语义推理的基础,欲以解决自然语言语义表达的多样性问题,近年来在计算机语言领域受到了极大关注。文本矛盾关系是蕴涵关系的一种否定,是指两个文本不能同时成立的一种关系。与文本蕴涵一样,文本矛盾识别对于文本语义理解来说也是一项基础而重要的任务,二者都是语义学的主要研究内容。本文在文本蕴涵关系识别的基础上,研究了如何识别文本矛盾关系,重点分析了矛盾文本背后的数字冲突、时间冲突、地点冲突、修饰语冲突、主宾颠倒、反义词、否定词等多种语言现象,从而达到准确识别文本矛盾的目的。本文提出了一种基于语言现象的矛盾识别方法,通过语言现象分析,将矛盾语言现象转换为矛盾语义规则与矛盾语义特征,在基于SVM的蕴涵识别系统的实验结果基础上,采用矛盾语义规则和两级分类器两种方法,对矛盾文本对进行识别优化,得到最终的实验结果。实验结果采用准确率、召回率和F值三种标准进行评估,实验结果表明,基于语言现象的矛盾检测方法对于中文矛盾关系的识别是可行且有效的,同时矛盾关系相对精确地识别也提高了文本蕴涵识别的准确率。