论文部分内容阅读
语义分析是自然语言处理研究的一项重要工作。与印欧语言不同,汉语中词类与句法成分没有严格对应关系,导致传统基于句法的语义分析方法不适宜于进行中文语义分析。概念图是一种已被证明优于经典的人工智能知识表示方法的语义知识表示方法,用概念图来表示中文的概念语义,将为中文语义信息处理研究提供新的思路。由于汉语是义符文字,以名词为中心,其表述语义的方式往往是通过词与词之间的耦合,表达概念之间的直接耦合关联,因此有必要在传统概念图基础上研究适合汉语语义表示的汉语内涵语义概念图。本文首先在传统概念图表示模型的基础上,提出面向汉语语义分析的内涵语义概念图表示模型,针对汉语句法分析存在的困难,采取弱化句法分析、注重概念内涵分析的策略,提出基于概念内涵分析的汉语内涵语义概念图生成过程,并针对现有概念图匹配不准确的问题,提出一种新的概念图匹配算法。本文的主要研究工作如下:一、针对汉语句法分析存在的困难,采取弱化句法分析、注重概念内涵分析的策略,在汉语概念内涵逻辑模型的基础上,提出一种适合汉语语义表示的汉语内涵语义概念图表示模型。二、在汉语内涵语义概念图表示模型的基础上,提出基于概念内涵分析的汉语内涵语义概念图生成过程。首先通过对基本概念进行分析,生成基本概念图;然后以复合结构的中心概念为核心,利用基本概念图进行概念图合并,形成复合概念图;最后对复合概念图进行简化。三、针对现有汉语语义计算中,概念图匹配计算存在不准确的问题,提出一种基于E-A-V结构相似度的概念图匹配算法。该算法以汉语概念内涵逻辑模型为基础,以内涵语义概念图为知识表示方法,结合E-A-V结构相似度计算方法,进行概念图匹配。实验结果表明该算法在概念图匹配上取得了较好的效果。四、在基于E-A-V结构的概念图匹配算法中,概念图的相似度是由E-A-V结构相似度求算术平均值得来的,针对此问题,在匹配算法中引入概念子图权重自适应调整机制。此算法在进行概念图相似度计算时,依据概念子图中包含的信息量占整张概念图信息量的比例赋予子图相应的权重。实验结果表明该算法能取得比原算法更好的效果。