论文部分内容阅读
自然语言理解是人工智能领域中的前沿难题之一。自从1954年第一个机器翻译系统的问世至今,经过计算机科学家、语言学家、心理学家们数十年的共同努力,在受限语言理解和面向领域的语言理解的研究中取得了卓著的研究成果,并在各个领域得到了广泛的应用,如基于自然语言的航空售票系统、天气预报系统等。然而,要达到自然语言理解研究的最终目标--让机器真正理解人类语言,仍然是一个遥远的梦想。自然语言理解的研究自底而上可划分为四个基本层次,分别是语言词典构造、语法分析、语义分析和篇章分析。目前国内外的研究成果在语言词典方面主要有Princeton大学的WordNet、Berkeley大学的FrameNet、Microsoft的MindNet、董振东的HowNet、俞士汶等的现代汉语语法信息词典等;在语法方面主要有Chomsky的短语结构语法和转换生成语法、Woods的扩充转移网络、Joshi等的树连接语法、Tesniere的依存语法等;在语义方面主要有Hjelmslev等的义素分析、Fillmore的格语法、Simmons等的语义网络等;在篇章分析方面主要有Minsky的框架理论、Schank的脚本理论、Rumelhart等的故事语法、Mann的修辞结构理论等。目前自然语言理解的研究中尚存在许多未解决的关键问题。在理论根源方面,人类语言的本质如何、运行机制怎样尚未探究清楚:在本领域研究本身,词典构造和篇章分析是其中两大弱项:1 如何构造语言词典使得其中包含尽可能多的语法、语义、语用信息来为其后的各阶段工作提供一个坚实的平台基础是自然语言理解的瓶颈之一:2 篇章分析的研究工作相对来说是自然语言理解研究的一个弱项,目前提出的各种篇章分析方法产生的实际效果不大。本论文从认知科学出发,对自然语言理解的本质和机制进行了探讨,并对领域研究本身词典构造和篇章分析两大关键问题提出了新的思路和方法。本论文主要工作和创新之处在以下几个方面:1 概括地论述了自然语言理解的历史和研究现状;从词典构造、语法分析、语义分析、篇章分析等四个层面完整地论述了自然语言理解的整个轮廓框架:并对自然语言理解研究的发展进行了展望。2 将认知心理学、认知语言学和人工智能的研究方法结合起来,从人类理解客观世界的角度从发对自然语言理解进行分析和研究。3 从认知心理学和认知语言学的角度出发,阐述了人类理解世界的机理和机器理解人类语言的困难所在。4 提出了一种基于认知机理的词典构造方法。5 提出了一种基于场景、Agent和状态图的篇章分析方法。6 构造了一个小型软件系统对提出的新方法进行了实验和测试分析。