汉语隐喻识别与解释计算模型研究

被引量 : 0次 | 上传用户:tonymin111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻是一种认知现象,同时又是一种特殊的语言使用现象,存在于语言和思维的方方面面,是人类语言和思维的中心问题之一。对隐喻的识别与解释计算模型的研究,为我们研究自然语言理解提供了一个更加深入的、动态的视角。本文围绕句子级别的汉语隐喻计算模型进行了深入而细致的研究。分析总结了隐喻语句表现形式特征和规律;提出了以隐喻接收者为中心的隐喻计算模式;给出了隐喻语句形式化分析方法,并建立了隐喻计算分类体系;提出并实现了一种隐喻识别方法,能够较大规模地识别不同类型的隐喻语句;提出并实现了一种新的隐喻意义获取和表述机制,能够有效针对所识别的隐喻进行字面意义的表示和真实意义的获取与解释。在此基础之上,研制了首个能完成对多种不同类型汉语隐喻的识别与解释任务的计算系统CHMeta。实验表明,本文所提出的汉语隐喻分类识别与意义解释的计算思想和方法是富有成效的。本文首先确立了以隐喻接收者行为特征为依据的隐喻计算模式,提出“隐喻识别与理解的可分性”假设,指出人们完全有能力识别他暂时不知道意义(相似点)的隐喻。隐喻的识别是一种隐喻接收者在其基本语言能力和常识范围内对语义异常产生的条件反射,这一过程不需要进行任何形式的相似性推理。隐喻的识别从复杂的隐喻理解中分离出来。在隐喻分类识别方面,提出了基于“隐喻角色依存模式”的形式化分析方法,并在此基础之上构建了汉语隐喻计算分类体系,包括2大系别和32种类别模式。每一种类别模式描述了一个最简的隐喻单元,模式之间可以进行相互嵌套与组合。该计算分类体系对隐喻表达的覆盖率达到95%,体现了分类结果的客观性。以此为基础,本文将复杂的隐喻识别引入模式识别的范畴,并定义了“指称异常度”和“搭配异常度”两个隐喻辨识的量化指标。具体过程是首先采用结构模式识别算法定位可疑的隐喻结构及相关词语,再通过参数计算得到可疑隐喻表达的隐喻可能性量化指标值,从而根据设定的隐喻阈值,进一步确认隐喻表达或排除非隐喻表达。识别系统在识别隐喻的同时还能完成对隐喻句的类别及句内相关隐喻成分的自动标注,从而有效地衔接了隐喻识别与后续的隐喻意义获取和解释环节的处理。实验显示了识别系统识别汉语隐喻语句的有效性,特别对新颖隐喻能做到有效的识别。在隐喻意义获取与解释方面,以隐喻识别结果为基础,给出了隐喻角色依存表示语言和隐喻角色框架来表示隐喻字面语义。提出了“基于目标概念(本体)属性驱动的隐喻意义获取机制”,指出对于单独的隐喻句而言,其隐喻意义来源于喻体的显著认知特征和句子内部的局部语境信息。完整的隐喻意义由隐喻喻源意义和语境意义两部分组成。隐喻的理解与意义获取的过程是人们根据目标概念(本体)所具有的属性从喻源概念的特征和局部语境特征中为目标概念的属性选择合适的属性值的过程。为了实现这一隐喻意义获取机制,我们定义了目标概念属性、喻源和喻底语境特征及各自的获取算法以及基于互信息矩阵的隐喻意义映射函数。由此得到隐喻转绎意义集合及其表示,同时定义了基于隐喻转绎意义的隐喻意义表述规则,最终完成隐喻真实含义的表述输出。本文的研究比较完整地给出了汉语隐喻分类识别与解释计算思想与方法,并实现了首个能够识别和解释大规模不同类型隐喻语句的计算系统CHMeta。本文的工作在汉语隐喻计算研究的道路中迈进了关键的一步,为隐喻计算理论和模型的深入研究和进一步发展奠定了一定的基础。
其他文献
当代大学生存在种种责任意识缺失现象:学习动机不强,对自我发展不负责任;感恩意识淡漠,家庭责任意识缺失;以自我为中心,对他人和集体缺乏应有的责任心;政治冷漠,社会责任感淡
采用遮荫(全光照、遮荫75%)裂区下的L9(34)正交设计对云南松种子进行微波辐射(A1、A2、A3分别为0、5、10 s)、IBA浸种(B1、B2、B3分别为0、0.10、0.20 g·L-1)试验,探究其对
检测发现,在装修后的室内空气中,以苯类和甲醛为主的有害气体含量有几百种之多;根据办公室和住宅装修后苯污染实测数据和苯的毒性分析,对比国家标准提出防控途径和治理措施,旨在提
图像融合技术是多传感器信息融合的一个非常重要的分支,近年来越来越受到重视。其中,红外与微光图像融合是基于不同传感器感应不同波段的辐射的原理,利用不同图像的信息互补
城市区域化和区域城市化成为当今城市发展的显著特征,形成了美国东北部大西洋沿岸城市群和北美五大湖城市群等五大城市群,影响着整个世界经济格局。在中国,珠三角、长三角和
民事证据契约(Beweisvertrag)是一个比较新的概念,属于诉讼契约的一种,指的是当事人在诉讼前或者诉讼中对民事诉讼中涉及的证据的收集、提出及运用等环节进行约定,以期影响法
被动多传感器多目标跟踪技术是目标跟踪系统的重要研究内容之一,在军事和民用领域已经展现出有效而广阔的理论和应用前景。但由于飞行器性能的提高及电子对抗等技术的进步,现
本文提出了一种应用于MIMO系统的新型低复杂度迭代接收机.接收端采用基于QR分解的干扰抵消,对不同层分组并进行部分并行干扰抵消,组内采用MAP联合检测输出软信息.通过交织解交织
本文以某钢筋混凝土简支T梁桥为工程背景,以《公路桥梁承载能力检测评定规程》(JTG/T J21-2011)与《公路旧桥承载能力鉴定方法》(试行)为依据,综合考虑桥梁的缺损状况、材质
<正>教材简析:义务教育课程标准实验教科书人教版语文四年级下册第八组选编《纪昌学射》和《扁鹊治病》两则寓言。这两则寓言均以生动的事例阐明某一道理。《纪昌学射》告诉