论文部分内容阅读
自然语言理解是人工智能的核心课题之一,其本质是对语言问题的方方面面在计算机当中的形式化研究。其中最突出的问题就是语义的形式化问题,它成为制约自然语言理解发展的瓶颈问题。本文的研究重点就是将语义问题以数学的方法在语言学上加以形式化。由于图是最接近人类思维结构的一种数学形式,因此,我们以知识图理论和概念图理论为平台,来研究语义的形式化问题。本文从“语义表示的形式化”和“语义推理的形式化”两个方面对自然语言语义理解技术进行了研究,并在讨论具体的形式化方法之前,对自然语言(语义)相关的人类认知过程进行了讨论。由于语言的问题不可避免的涉及到人类的思维,因此对于自然语言的语义理解来说,认知科学的研究是非常关键和必要的,甚至可以说是决定性的。 首先,本文将认知科学中的信息加工理论和心理模型理论融合在一起,建立了认知模型(Cognitive-Model)。然后,在此模型基础上围绕“信息”和“心理模型”讨论了与语言和语义相关的哲学话题、逻辑学话题和心理学话题,为具体的语义形式化方法提供了指导。 然后,基于知识图理论,本文研究了“语义表示形式化的问题”。一个基本观点是:人们在意识中有一种结构化的表达,即心理模型,语义就是语言所代表的心理模型,它是由概念构建的一种结构。随后,本文以汉语为平台,具体从概念、结构、词与概念的对应关系,语法与结构的对应关系这四个方面进行了知识图形式化的研究。 最后,基于概念图理论,本文研究了“语义推理形式化的问题”。从形式演绎和模型理论两个方面讨论了概念图的语义推理机制。随后,针对封闭世界模型下的概念图推理过程提出了一种基于博弈树的求解算法,该算法可以实现对封闭世界模型下任一个概念图或概念图集“真值”的识别。