XML流的复杂查询处理及其优化技术

来源 :复旦大学 | 被引量 : 0次 | 上传用户:teer197841
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已经成为Intemet上数据交换的标准。XML不仅可以作为一个完整的文件传输,而且还有可以以一种串行数据流的方式传输。近年来,针对XML数据流的处理在研究领域引起了广泛的兴趣。XML流处理的挑战是如何能有效地处理巨量的针对XML数据流的查询集。这种查询通常是基于路径表达式的,如XPath、XQuery。 随着应用需求的增长,查询表达式也变得越来越复杂。我们发现,对于具有嵌套AND/OR谓词的复杂TwigPattem查询,目前还没有有效的处理方法。为此,我们开发了一个称为LeoXSQ的XML流处理系统。在LeoXSQ中,我们提出一种新的方法解决上述查询问题。围绕LeoXSQ,我们还开发了节点缓存管理组件和基于DTD的查询优化组件。本文的主要贡献概括如下: 1)提出一种新的方法处理具有嵌套AND/OR谓词的复杂twigpattern查询。在该方法中,将AND/OR谓词作为单独的抽象语法树来处理,利用基于运行时栈的算法,结合自顶向下与自底向上的过程,有效处理针对XML流的复杂twigpattem查询。 2)将所有twigpattem组合成单个可共享前缀的查询树,从而可以节省查询处理的空间与时间,并以输入的XML流顺序单遍处理所有的查询。通过对查询树中逻辑表达式进行公共子表达式的共享处理与短路计算,进一步提高了查询处性能。 3)提出了一种针对单个查询的基于语义链的缓存管理算法,并将其扩展并应用到前缀共享的多查询环境下。该算法能够以尽可能小的缓存空间处理递归嵌套文档与一对多关系文档。基于一种基于运行时栈的XML部分编码技术,来判断缓存节点间语义关系。这种方法只对进入运行时栈的节点编码,大大缩小了编码的范围。 4)分析影响XML流数据处理性能的关键因素。利用正则树文法和树自动机作为理论指导,阐述了使用DTD进行查询优化的方法。基于该方法,实现了查询优化组件。该组件在系统运行前进行预处理,不影响系统运行时的性能。
其他文献
深水管道的铺设是一项复杂的工程作业,实际铺管的过程当中涉及多种工艺流程、以及多个操作过程包括起始铺管、正常铺管、弃管和收管过程,并受到海流、海浪、天气等恶劣环境的
现在网络技术的飞速发展要求不断出现新的安全技术来保护信息的安全,为了保护内部网络的信息不受非授权用户的攻击,人们最常采用的手段是防火墙技术,它能有效地阻止非授权用
本文在对长春印刷机械有限责任公司的业务进行需求分析的基础上,依据软件工程的基本思想并利用统一建模语言(UML)对长春印刷机械有限责任公司管理信息系统进行了分析和设计。
该论文研究了安全测评的相关技术和发展方向,分析了网络安全评估软件常用的体系结构,最后设计了一个基于web的安全测评系统。该系统采用改进的三层B/S体系结构。客户端使用浏览
随着Internet网络安全性要求的不断提高,公钥基础设施(Public Key Infrastructure,PKI)得到越来越广泛的应用,但其部署难度大和交互性差等缺点却阻碍了它的进一步推广。为了
船舶报警系统是船舶自动化的重要组成部分,由各种报警信号检测部分,控制部分,报警信号的发出部分组成。本论文中主要研究报警信号的发出和控制部分,其功能主要是报警控制器根据检
随着信息检索技术的发展,关键字搜索技术一直都受到学术界的高度关注,它在数据库、信息检索以及数据挖掘等领域一直是研究的热点。随着网络上数据的爆发式增长,以及大量图数
IPv6是下一代网络的基础协议。随着IPv4地址的枯竭,人们开始准备部署IPv6。网络地址翻译-协议翻译(NAT-PT),是现阶段实现IPv6节点和IPv4节点相互通信的重要方法之一。而应用层网
嵌入式文件系统是嵌入式实时操作系统的一个重要组成部分,随着嵌入式系统硬件设备的的可获得性的提高和价格的不断降低以及嵌入式系统应用范围的不断扩大,嵌入式文件系统的重要
作为一门新兴的技术,无线传感器网络(WSN, Wireless Sensor Network)的应用前景无限广阔。只需要将大量体型微小的传感器节点部署到目标区域,就可以使用这些节点采集区域内的