基于百科知识的名词性隐喻识别与解释研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:liangxiaoyan0307
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻是人类基本的思维方式之一,在自然语言中,隐喻的使用是一种非常普遍的现象。现今,隐喻已经成为了语言学家,心理学家和认知科学家所关注的课题之一。一切自然语言处理系统的本质都是基于知识的系统,如果机器要实现对一个表达的理解,所需要的知识与人完成同样任务所需要的知识是无差别的。而隐喻的机器处理在知识库的使用上,经历了从手工构造隐喻概念映射库,到手工构造的语义网知识库的过程。本文的研究目的,是将隐喻所使用的知识库扩展到最自然和最能被人们所接受的百科知识库,从而弥补手工构造知识库存在的代价高和规模小的缺点。   本文分析了现有的隐喻处理思想,根据隐喻是一个“求同存异”的过程的思想,将其分为“求同”和“存异”两个部分。其中“存异”用于对隐喻进行识别,判断隐喻表达的表面语义是否存在语义矛盾,作为隐喻识别的标准;“求同”用于对隐喻进行解释,根据喻体的特征和本体的属性是否匹配,进行隐喻的解释。   在名词性隐喻识别方面,根据构成隐喻的本体和喻体分属不同的概念域中的特点,提出了基于百科的名词性隐喻识别方法。利用信息检索技术,从概念对应的百科页面中获取概念的世界知识,计算两个概念的世界知识的重合程度,作为判断概念是否属于同一个概念域的依据,进行隐喻的识别。实验结果证明在使用百度百科作为世界知识库时,隐喻/常规表达的识别正确率达到81.06%,显示了识别算法对汉语名词性隐喻识别的有效性。   在名词性隐喻解释方面,根据构成隐喻的本体和喻体具有某些相似性的特点,提出了基于百科的名词性隐喻解释方法。隐喻的解释是基于互动论的过程,是模拟人类根据喻体所提供的显著特征,决定本体如何选择喻体特征,如何利用喻体特征对本体进行描述的过程。为了实现这一隐喻解释的机制,本文提出了喻体特征、本体属性的获取算法和基于互信息的特征转移算法,最终实现隐喻的语义解释。   综上所述,本文的研究给出了基于百科知识作为语义知识库进行汉语名词性隐喻识别与解释计算的思想与方法,在汉语隐喻计算的研究道路上作出了试探性探索,为隐喻计算的资源、理论和模型的进一步研究与发展奠定了一定的基础。
其他文献
数据图是由若干给定的点及连接两点的线所构成的图形,通常用来描述事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间的关系。以往的学者提出了许多数
社区是城市的基本构成元素,也是城市居民的生活空间与发展载体,社区智慧化程度集中反映着城市的智慧水平。“智慧社区”是城市现代化发展进程中的一项重要成果,为城市社区的
设计和实现磁共振图像纹理分析平台,探索基于磁共振图像纹理分析方法对肝脏肿瘤恶性程度进行恶性程度轻级重级分类的算法,可为肝脏肿瘤恶性程度轻重级分类提供新的无创无毒副作
本课题来源于某集团网络办公自动化系统(Office Automation System,简称为OA系统)集团化改造项目。因组成集团公司的各分公司(将集团机关视作一个分公司)地理分布不同、业务
伴随物联网技术迅速发展,作为物联网重要技术之一的无线射频识别技术(Radio Frequency Identification, RFID)也越来越得到人们的关注。RFID技术是一种很强大的自动识别技术,
图像融合是由信息融合发展而来的,是多传感器信息融合中可视信息的处理,根据互补性,把来自多个传感器的数据信息综合起来,得到一个信息更丰富的图像。近年来,图像融合技术在
随着社会的进步和科技的飞速发展,人们的生活已经越来越离不开网络了,为了满足人们日益增长的需求,海量的网页信息也随之产生了,如何从这些海量的信息中找到人们所需要的信息
信息全球化的不断发展,网络技术发展不断成熟,信息交换的发展更加的细化,很多企业甚至是规模较小的企业都拥有自己的完善的内部网络系统,通过内部网络更加安全的完成企业内部
随着现代战争的突发性、快速性和复杂性的不断增强,这就要求通信必须迅速、准确和不间断地传输信息。因此,在指挥自动化系统中,良好的通信保障,是实施及时、正确指挥和快速作
电信运营商OSS(Operational Support System)即电信业务支撑系统,是一个自动化、高性能的电信业务引导、修复及开通运行的支撑系统,利用OSS可以向用户提供多种多样并且稳定可