自然语言理解的研究

被引量 : 0次 | 上传用户:tongjm2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解是人工智能领域中的前沿难题之一。自从1954年第一个机器翻译系统的问世至今,经过计算机科学家、语言学家、心理学家们数十年的共同努力,在受限语言理解和面向领域的语言理解的研究中取得了卓著的研究成果,并在各个领域得到了广泛的应用,如基于自然语言的航空售票系统、天气预报系统等。然而,要达到自然语言理解研究的最终目标--让机器真正理解人类语言,仍然是一个遥远的梦想。自然语言理解的研究自底而上可划分为四个基本层次,分别是语言词典构造、语法分析、语义分析和篇章分析。目前国内外的研究成果在语言词典方面主要有Princeton大学的WordNet、Berkeley大学的FrameNet、Microsoft的MindNet、董振东的HowNet、俞士汶等的现代汉语语法信息词典等;在语法方面主要有Chomsky的短语结构语法和转换生成语法、Woods的扩充转移网络、Joshi等的树连接语法、Tesniere的依存语法等;在语义方面主要有Hjelmslev等的义素分析、Fillmore的格语法、Simmons等的语义网络等;在篇章分析方面主要有Minsky的框架理论、Schank的脚本理论、Rumelhart等的故事语法、Mann的修辞结构理论等。目前自然语言理解的研究中尚存在许多未解决的关键问题。在理论根源方面,人类语言的本质如何、运行机制怎样尚未探究清楚:在本领域研究本身,词典构造和篇章分析是其中两大弱项:1 如何构造语言词典使得其中包含尽可能多的语法、语义、语用信息来为其后的各阶段工作提供一个坚实的平台基础是自然语言理解的瓶颈之一:2 篇章分析的研究工作相对来说是自然语言理解研究的一个弱项,目前提出的各种篇章分析方法产生的实际效果不大。本论文从认知科学出发,对自然语言理解的本质和机制进行了探讨,并对领域研究本身词典构造和篇章分析两大关键问题提出了新的思路和方法。本论文主要工作和创新之处在以下几个方面:1 概括地论述了自然语言理解的历史和研究现状;从词典构造、语法分析、语义分析、篇章分析等四个层面完整地论述了自然语言理解的整个轮廓框架:并对自然语言理解研究的发展进行了展望。2 将认知心理学、认知语言学和人工智能的研究方法结合起来,从人类理解客观世界的角度从发对自然语言理解进行分析和研究。3 从认知心理学和认知语言学的角度出发,阐述了人类理解世界的机理和机器理解人类语言的困难所在。4 提出了一种基于认知机理的词典构造方法。5 提出了一种基于场景、Agent和状态图的篇章分析方法。6 构造了一个小型软件系统对提出的新方法进行了实验和测试分析。
其他文献
综述了动力电池研发历程,对各类车载电池的性能、价格等进行了比较,介绍了动力电池在电动车(EV)、混合电动车(HEV)和电动自行车(EB)的应用市场。着重讨论了阀控铅蓄电池(VRLA
在当时天崩地裂的复杂局势以及阶级矛盾和民族矛盾相互激荡的时局下,王夫之深沉反思,执着于理论创造,发扬和总结了中国古代传统人文主义思想的精华,对老庄、佛学和宋明理学进
<正>●教材分析本节内容选自教育科学出版社《网络技术应用》第五章第四节《ASP脚本的应用》,介绍动态网页技术ASP,是对前三节内容的补充。其教学要求是让学生通过一个ASP的
今文《尚书》是华夏民族文化的源头文献之一,以记言为主,叙述、描写为辅,比较系统全面地反映了商周的语言风貌。研究今文《尚书》语言对于上古汉语史的研究具有重要价值。
<正>●教材内容及设计思想本节是在学生学习并掌握了数据的计算、筛选等功能及其图形化表示后的一节内容,针对同一组数据进行多次分析,使学生体验从不同的角度挖掘数据所蕴含
尽管西安在明城格局及重点文物建筑的保护上卓有成效,但是作为明城区历史遗存主体内容的城市形态遭受的破坏却日益严重,西安的历史特征正在慢慢消失,变得与其它城市越来越相
水是生命之源,是人类生存和社会经济发展的物质基础,是可持续发展的主要保障。随着经济的高速发展,水资源的相对紧缺已经成为制约区域经济发展的主要因素之一。水资源优化配
概述了我国铅蓄电池产业的布局、市场、生产、技术及装备等现状;通过与美日等发达国家铅蓄电池产业的对比,分析了我国铅蓄电池产业发展存在的主要问题;展望和分析了国内铅蓄
目的探讨外剥内扎缝合术配合硬化剂注射治疗混合痔的疗效。方法将72例混合痔患者行剥扎缝合术配合硬化剂注射治疗的临床资料作回顾性分析。结果 72例患者全部治愈,平均住院10
关于日本流行语的研究,中日两国的学者都进行了许多的探讨。但是从日本社会历史发展角度系统分析日本流行语的研究在中国还不多见。研究可从日本近代各历史时期流行语产生的