论文部分内容阅读
隐喻充斥着人类的语言和思想,它不仅是一种修辞现象,更是人类认知世界的一种思维机制。在自然语言处理领域,隐喻的识别、理解和情感分析等计算任务扮演着不可或缺的角色,制约着机器翻译、对话系统、舆情分析等自然语言处理任务的发展。前人工作大多是面向隐喻识别和隐喻理解进行的,不同于此,本文以隐喻情感计算为主要任务。隐喻的情感计算与语境有着密不可分的关联,而语境主要包括上下文信息和文化背景信息。前人工作主要将着眼点放在上下文的影响上,对文化因素的作用探讨较少。实际上,文化背景的差异会对隐喻情感计算结果造成显著影响,比如,不了解中国文化背景的读者可能就无法正确判断“这个市场是块唐僧肉”这种隐喻的情感极性。因此,我们提出了考虑文化因素的隐喻情感计算研究课题,希望构建能够考虑文化因素的隐喻情感极性计算模型和隐喻情感类型计算模型。本文以概念隐喻理论为基础,提出“文化相关属性映射”的观点。我们认为一个概念的文化相关属性是被文化背景中所特有的、与该概念相关的概念隐喻定义的。基于此,构建“文化属性知识库”作为隐喻情感极性计算中的文化背景信息来源,开发结合文化相关属性知识和注意力机制的长短期记忆神经网络模型,对隐喻的情感极性做二元分类。在隐喻情感类型分析方面,我们发现中国传统文学评论对情感的分析离不开氛围和意境,通常认为氛围、意境是情景交融而达到的境界。因此,认为“氛围”可以作为一种情感分类特征。基于语料统计结果和相关研究,将文本的氛围划分为“静谧幽远”、“清冷幽寂”、“雄奇壮阔”等12种类型。结合氛围的整体性和上下文相关性等特性,提出用“文化相关情感映射”描述词语的氛围特征。进而基于词语的氛围特征和长短期记忆神经网络模型完成隐喻的情感类型计算。综上所述,本文提出了考虑文化因素的隐喻情感极性计算和情感类型计算,阐述了相关研究理论,实现了自动化的计算系统,为隐喻情感计算研究提供了新的思路。