论文部分内容阅读
隐喻作为自然语言中的一种常见现象,不仅仅是一种修辞手段,更是人类的一种认知方式。现如今,隐喻已经成为语言学、认知学、计算机科学等研究的重要课题。隐喻理解也是自然语言处理中不能避免的任务。 从认知的角度考虑,隐喻的表达遵守“相关”原则,即目标域和源域之间存在某种相关性。相关性是基于认识概念的角度产生的,例如性格、功能、颜色等。如果两个概念在某种角度上产生关联,就认为两者在该角度具有相关性。而隐喻理解就是寻找最佳的相关性的过程。又因为隐喻的开放性和不确定性,人们可能在目标域和源域之间找到多个相关的角度,产生不同的解释。为了避免错误的理解,上下文往往会提供足够的信息。在此基础上,本文提出基于角度的语义相关关系,利用上下文信息中的相关性构建跨层次多角度的相关性模型。我们的相关性模型包括多层次语义特征,不仅包括概念,概念的属性特征以及感知特征,还包含全局特征信息,如上下文信息、背景知识、主题等。模型通过多种角度的相关关系将跨层次的语义信息关联起来。我们将模型运用到名词隐喻理解任务中,提出了基于潜在角度的隐喻理解计算方法和基于明示角度的隐喻理解推理方法。 在基于潜在角度的隐喻理解部分,我们利用隐含的角度计算目标域和源域的相关程度。首先,我们基于词、词的主题及语篇的主题扩展出多层次的语义表示。然后,我们计算概念间的相关程度,生成相关性模型。接着,我们采用random walk的方法,通过迭代计算获得隐含角度的相关关系。最后,选择与目标域具有最大相关度的属性作为隐喻理解的结果。 在基于明示角度的隐喻推理部分,我们利用明确角度的相关关系推理目标域和源域如何产生相关性。我们从上下文信息中获得相关关系,并根据角度转换、相关性传递等推理规则,推导出目标域和源域产生关联的角度。模型选择具有最大相关程度的角度作为隐喻的理解结果。 综上所述,本文利用上下文相关性实现隐喻理解,创新性地提出基于角度的语义相关关系。实验结果表明我们提出的基于角度的隐喻理解方法是合理的,我们的方法能有效利用跨层次语义信息实现隐喻的正确理解。