基于XQuery的NXD查询的研究

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:sevenqjq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(extensible markup language,可扩展标志语言)是由World Wide Web Consortium(W3C)的XML工作组定义的。XML以其扩展性、结构性、平台独立性和自描述性等特性成为数据表示和交换的事实标准,越来越多的行业都使用XML来存储、交换和发布信息。在存储和查询XML数据这一领域,主要有两种方法:一种是在已有的关系数据库系统和面向对象数据库系统的基础上扩充相应的功能,使其能够胜任XML数据的处理,这种数据库称为XML Enabled数据库;另一种是为XML数据量身定做的数据库,即Native XML数据库(可简写为NXD)。Native XML数据库充分考虑到XML数据的特点。但是,跟传统的数据库相比,Native XML数据库比较新,在理论和实现技术上还不成熟,特别是查询方法、规范化和引用完整性等方面,是当前数据库领域研究的一个重点。为了规范XML查询,W3C还设计了XML查询语言——XQuery,它符合XML的原始结构,相当于XML数据管理领域的SQL(Structured Query Language)。本文主要研究的是支持XQuery查询语言的Native XML数据库查询技术。首先对XQuery语言和Native XML数据库及其特点进行了深入研究,指出NativeXML数据库与传统数据库在处理XML数据方面的不同,总结了XQuery查询处理过程,并探讨了XML查询处理中常用的方法,然后设计了一个针对Native XML数据库的XQuery查询。通常在Native XML数据库中进行XML查询主要是通过模式匹配或导航的方法,本文所设计的查询分别用数据管理器和索引管理器对基于树导航和模式匹配两种查询方法进行管理。在查询处理过程中,将Unnest算法和ZigZag Join算法融合,提出comb(U+Z)算法,用该算法使两种查询方法结合起来共同执行查询,产生多个查询计划,然后用代价模型估计查询计划代价,选择最优的查询计划。通过实验测试表明,使用comb(U+Z)算法进行查询处理,一些查询产生的混合的查询计划比原有的只用单一一种查询方法产生的查询计划的执行时间更短,采用的代价模型估计查询计划代价以选择最优查询计划的方法是正确的。最后,对XML数据模型进行分析研究,针对XPath数据模型不支持元数据查询的这一缺陷,通过添加一个Meta属性对XPath数据模型进行扩展改进。
其他文献
随着信息科技的发展,人脸识别技术正日益显示出其价值,因此受到了研究人员的广泛关注。目前,研究人员提出了各种有关人脸识别的方法,也取得了一定的成果。但是由于多种因素会
在无线局域网接入互联网环境下,无线链路固有的特征(如高误码率、RTT变化大、主机切换等)导致基于固定主机和有线网络设计的传统TCP在无线环境下有很大的局限性。其中一个主
水电仿真系统是一个大型综合的实时仿真系统。水电仿真系统根据特定仿真算法产生运行数据来模拟水电站运行。能够模拟水电站的各种工况,包括开机、停机以及并网之后的工作状态
分布式网络系统具有资源共享,通信便捷,实时控制,风险分散等优势,完全适应信息社会的发展趋势,具有广阔的应用前景。然而在分布式网络系统中,电子数据和信息能够被快速而广泛
随着互联网的发展,企业的实际应用中可能会遇到数据库分布在不同地点的情况,而且这些数据库存在着异构性,这样开发实际应用需要对这些分布式的异构数据进行有效集成。同时由
近年来,伴随盲源分离问题产生的独立分量分析(Independent Component Analysis,简称为ICA)理论已逐渐成为统计信号处理中的一个重要研究方向,并正在迅速成为多维数据分析的一
与传统的周期性汇报或基于查询的无线传感器网络不同,事件驱动型无线传感器网络只有在监测范围内的事件发生时才向Sink节点发送事件报警消息,无事件发生时只发送一些网络健康状
图论是组合数学领域的一个分支,20世纪60年代末,随着计算机技术的产生和发展,组合数学,特别是图论理论得到了人们越来越多的关注,时至今日,人们面对的计算模型以及数据结构仍然在变
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料库的建设对于双语词典编撰、词义消歧和跨语言
粗糙集能有效地处理不精确、不完整等各种不完备的信息与知识,它与其他不确定性理论的最大区别就是除了需要处理的数据集外,不需要其他任何先验知识,通过直接对数据进行分析