隐喻机器理解的若干关键问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wtbcgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言理解是人类智能的一项重要特性,隐喻作为自然语言中的一种普遍现象,体现了人类重要的思维方式。隐喻是人类概念系统的一部分,我们的许多思考方式以及所体验的事物对认知活动所造成的影响,实际上都是隐喻的某种表征。随着隐喻认知研究不断深入,隐喻理解的认知机制及其计算化研究显得十分迫切,尤其是在提高自然语言理解的效果方面更是如此。本文从当前隐喻理论的研究热点入手,在总结现有隐喻计算模型的基础上,提出隐喻计算化研究需要解决的关键问题,就隐喻语言的形式化描述与分类识别、隐喻理解中的知识表示问题、隐喻的映射问题以及认知主体的主观因素等方面进行重点探讨。在隐喻语言的形式化描述与分类识别问题上,根据语言学领域对隐喻语言的定义,将隐喻语言划分为指称型隐喻和搭配型隐喻两大类。以依存语法理论为句子形式化的基础,将句子描述为依存结构树,并通过对大量隐喻句依存结构树的详细分析和归类,得出隐喻句的各种依存模式,最终提出一种高效的树模式匹配算法,快速有效地识别句子依存结构树中可能存在的隐喻单元位置。针对指称型隐喻的判别,给出一种基于上下位语义关系的指称可适度量化公式:当两个词语的指称可适度低于设定的阈值时判定为存在指称隐喻;针对搭配型隐喻,提出一种基于实例和语义知识库相结合的搭配可适度量化方法:当两个词语的搭配可适度低于设定的阈值时判定存在搭配隐喻。最后根据隐喻依存模式提供的规则判断具体的隐喻类别和隐喻角色标注。在隐喻的理解问题上,结合语用学和认知语言学在隐喻理解方面的各类观点,特别是语用学对隐喻理解过程的论述和认知语言学关于隐喻表征映射方面的研究成果,采用本体技术作为概念知识的表示方法,依据概念合成理论框架,将隐喻映射问题转化为由本体表示的心理空间之间的概念映射问题。论文把概念合成框架中的类属空间表示为由知网义原体系扩展构成的通用本体,把输入空间看作是一个在线的知识结构,同样由本体模型来描述。输入空间本体通过隐喻依存结构树中各隐喻角色来获取,其中源域角色(Met_S)和目标域角色(Met_T)经过词汇概念本体获取对应的概念,并从句子的语义角色分析和语义知识库获取相关的论元角色类型。根据三角规则和修整规则对两个输入空间本体中的概念进行映射匹配,并根据映射的整合度对各个匹配进行评估,进而形成合成空间来解释隐喻。隐喻的理解涉及认知主体的主观认知状态,包括隐喻话题的世界知识、认知主体的信念、意图等。以往的隐喻计算研究忽略了隐喻理解过程中的这一特性,强调客观知识的作用,因而更多关注于隐喻的语言特征和世界知识的表示。基于此,本文在对隐喻理解过程进行逻辑刻画时,引入认知主体的主观因素,利用认知逻辑中的认知模态算子,给出隐喻理解的一种认知类比逻辑模型,并将该模型应用于汉语隐喻的理解。论文最后实现了一个隐喻机器理解系统MetaphorSuite。系统整合了句子依存结构分析及可视化修正标注功能、隐喻依存模式匹配算法及隐喻识别标注功能、隐喻映射释义功能等。MetaphorSuite系统为隐喻计算的进一步发展提供了一个完整的平台,特别是隐喻语料库和隐喻知识库等基本资源的构建。
其他文献
快速检测铜丝可变形能力、提高铜球可变形性和铜丝热影响区(Heat Affected Zone, HAZ)拉伸强度以及系统研究Cu/Al键合点可靠性问题是铜丝球焊技术应用和发展的关键。本文建立
老鹰是所有鸟类中最强壮的种族,根据动物学家所做的研究,这可能与老鹰的喂食习惯有关。
图书室是学校的文献资料中心,可以为学生提供丰富的阅读资源,有利于推动课外阅读教学的发展。结合教学实际,从帮助学生掌握正确选择图书的方法、指导学生掌握正确的阅读技巧
发酵工程是生化工程和现代生物技术及其产业化的基础。在发酵工程领域,为了提高发酵水平和生产率,更多的研究工作集中在菌种的筛选和改造上。尽管现代生物技术的发展,在基因
旅游是一种消遣和消费的过程,花钱享受异地的风光、风情、美食和服务。有人说旅游就是从你活腻歪的地方到别人活腻歪的地方去。讲究什么呢?讲究走得顺利,住得舒适,玩得开心,食得美
江神子·金陵怀古(一)秦淮灯影乌衣巷,金风爽,玉露凉。当年王谢,烽火拒敌羌。为复社稷驱河洛,拥神器,襟怀壮。