数据库自然语言接口研究与实现

来源 :青岛大学 | 被引量 : 0次 | 上传用户:cnmeim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库自然语言接口(Natural Language Interface of Database,NLIDB)是人工智能研究的重要分支之一,主要涉及到计算机自然语言理解和数据库用户接口等关键技术的研究。在用NLIDB访问数据库时,用户输入的是自然语言查询语句,因此对其自动识别的程度是数据库自然语言接口的一项关键技术。目前,国外围绕英、日等语种的这方面的研究已渐趋成熟,但是由于汉语中词与词间没有明显界限、语法复杂以及语义繁多等原因,对汉语自然语言的自动识别极大地制约了NLIDB应用的拓展。本文在深入研究计算机自然语言处理技术的基础上,围绕汉语自然语言自动识别中上述存在的问题设计实现了基于不确定有限自动机(NFA)模型的数据库自然语言通用接口系统NLI-NFA。 NLI-NFA系统实现过程分为三大部分:分词、自然语言评判和中间代码以及目标代码生成。在分词过程中,依据汉语长短语出现频率高的特点,提出了带回溯的最大匹配算法,该算法能够对汉语查询语句进行准确切词,时间复杂度较低。在自然语言评判过程中,采用了不确定有限自动机模型,根据汉语查询语句语法简单且句子间无上下文相关的特点,定义了受限语言文法和状态集合,将分词结果作为NFA模型的输入字符,NFA模型进行带回溯的状态转移,若状态转移至终态,则说明该查询语句可以被NFA模型所接受,即该自然语言可以被理解;否则其无法被理解,请求用户转化语句格式重新输入。在中间代码以及目标代码生成过程中,若该查询语句被接受,提出了一套中间代码生成机制来生成中间代码,最后由应答机制将中间代码转化成目标SQL语言,获得查询请求,进行数据库查询访问,最后根据查询结果给予用户相应的应答。 利用完成的NLI-NFA系统对学校的学籍管理数据进行了实际查询访问,实验结果表明本文实现的系统是有效的。 全文共分六章,各章的内容分别为: 第一章简要介绍了数据库自然语言接口的研究意义、特点以及国内外研究的动态,提出了当前研究中存在的问题,确定了本文的研究范围和基本框架。 第二章主要介绍了系统采用的非确定有限自动机模型以及系统定义的文法、状态集合等。
其他文献
随着互联网的进一步发展,合法和非法的信息大量充斥其间,基于内容的信息安全已经成为安全领域的一个新焦点。为了给用户能提供健康的、安全的信息,就有必要对非法网页进行过滤处
对自然景物模拟与绘制方法的研究一直以来都是图形学领域的热点研究问题,而植物场景的模拟则是其中一个重要的组成部分。本文主要讨论了真实感植物场景的图形学生成方法,就其中
随着语义网研究的不断深入,对大规模RDF图进行语义推理的速度之慢日益凸显。在传统的语义推理机制遇到瓶颈时,应用MapReduce和HBase来实现大规模RDF图的并行推理成为新的突破口
随着多媒体技术及Interner技术的迅速发展,各行各业对图象的使用越来越广泛,图象信息资源的管理和检索显得越来越重要。如何有效的管理和检索图象数据是多媒体以及数据库技术
数字电视被称为继黑白电视和彩色电视之后的第三代电视,由子它采用数字压缩编码技术处理视频、音频信号,使得电视广播以崭新的面貌出现,不仅提高了视频、音频的质量,而且提供
随着社会发展和科技进步,人们对空间信息标绘的应用越来越多,对空间信息标绘的获取和使用也正在向分布式、交互式和以数据服务为中心转变,希望在网络地理信息标绘平台上对感
随着农业现代化的发展,农业用户对于农业信息资源产生了巨大的需求,近年来由于云计算、物联网、移动通信等高新技术的广泛应用以及政府和企业对农业信息化建设的积极倡导和推
传统的工业缝制设备大多采用基于单片机的控制系统,随着科学技术的进步和应用的需求,21世纪的缝制设备已进入基于小型电子控制系统的智能化时代。智能电子花样机将传统的机械
网络化制造ASP服务平台是一个大型复杂的集成应用系统,它以Internet为媒介,通过浏览器和分布在不同地域的用户进行交互,特别是借助Web服务技术,使处理复杂的业务和数据变得方
随着网络技术的快速发展,动态网络群体在网络中产生了重要的影响,其自适应性、高度复杂性与动态变化性,给传统的网络分析方法带来了诸多挑战。复杂网络理论以其在研究大型复