论文部分内容阅读
隐喻是人类基本的思维方式之一,在自然语言中,隐喻的使用是一种非常普遍的现象。现今,隐喻已经成为了语言学家,心理学家和认知科学家所关注的课题之一。一切自然语言处理系统的本质都是基于知识的系统,如果机器要实现对一个表达的理解,所需要的知识与人完成同样任务所需要的知识是无差别的。而隐喻的机器处理在知识库的使用上,经历了从手工构造隐喻概念映射库,到手工构造的语义网知识库的过程。本文的研究目的,是将隐喻所使用的知识库扩展到最自然和最能被人们所接受的百科知识库,从而弥补手工构造知识库存在的代价高和规模小的缺点。
本文分析了现有的隐喻处理思想,根据隐喻是一个“求同存异”的过程的思想,将其分为“求同”和“存异”两个部分。其中“存异”用于对隐喻进行识别,判断隐喻表达的表面语义是否存在语义矛盾,作为隐喻识别的标准;“求同”用于对隐喻进行解释,根据喻体的特征和本体的属性是否匹配,进行隐喻的解释。
在名词性隐喻识别方面,根据构成隐喻的本体和喻体分属不同的概念域中的特点,提出了基于百科的名词性隐喻识别方法。利用信息检索技术,从概念对应的百科页面中获取概念的世界知识,计算两个概念的世界知识的重合程度,作为判断概念是否属于同一个概念域的依据,进行隐喻的识别。实验结果证明在使用百度百科作为世界知识库时,隐喻/常规表达的识别正确率达到81.06%,显示了识别算法对汉语名词性隐喻识别的有效性。
在名词性隐喻解释方面,根据构成隐喻的本体和喻体具有某些相似性的特点,提出了基于百科的名词性隐喻解释方法。隐喻的解释是基于互动论的过程,是模拟人类根据喻体所提供的显著特征,决定本体如何选择喻体特征,如何利用喻体特征对本体进行描述的过程。为了实现这一隐喻解释的机制,本文提出了喻体特征、本体属性的获取算法和基于互信息的特征转移算法,最终实现隐喻的语义解释。
综上所述,本文的研究给出了基于百科知识作为语义知识库进行汉语名词性隐喻识别与解释计算的思想与方法,在汉语隐喻计算的研究道路上作出了试探性探索,为隐喻计算的资源、理论和模型的进一步研究与发展奠定了一定的基础。