基于SF&B压缩存储结构的XML数据查询方法的设计与优化

来源 :中南大学 | 被引量 : 0次 | 上传用户:q3177848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已经成为网络上一种存储、交换、发布信息的标准格式,它具有规范的自描述结构,易于被创建和解析,并且可以被嵌入到应用程序中。随着近年来Web Service的蓬勃发展,XML越来越多地活跃在数据交换和存储领域,用XML表示的半结构化数据得到越来越普遍的应用,XML已经成为Internet上信息表示和交换的重要标准。然而,由于XML数据大幅增长以及XML数据存在着非常大的冗余,如何有效的存储和查询大规模的XML数据成为当前研究的一个热点问题。当处理大数据量XML数据时,首要的是为之建立行之有效的磁盘存储结构。为此,本文首先提出了一种基于F&B索引的XML数据的磁盘压缩存储结构SF&B,其优点在于:一方面,SF&B摒除了传统存储方法中相同的值信息重复存储带来大量冗余的问题另一方面,该结构引入的同带索引与反向索引结构将具有相同性质的节点聚集在一起,使得可以快速的定位到满足条件的节点集,很好的支持了其上的查询处理。其次,给出了基于SF&B存储结构的一系列查询处理算法:第一,对于含值的查询,在过滤掉大量的不满足条件的中间结果的同时,减少了大量中间结果的匹配操作,高效的实现了Disk-basedF&B中无法处理的含值的查询,并且相对于正向先匹配结构信息后判断值信息的算法,查询的效率也有着显著的提高。第二,对于分支查询的处理,相比于Join的方法,所需遍历的节点数量得到很大程度的降低,并且无须保存中间结果即可得到最终结果集,内存开销极小,使得分支查询的处理效率明显提高。第三,对于单路径查询的处理,本文提出的方法可以迅速定位出匹配查询条件的结点,减少了需遍历的节点数量,提高了查询处理效率。最后,对SF&B上的查询处理算法进行优化,借助SF&B中的辅助信息,寻找查询的优化执行顺序,进一步的提高了单路径查询处理的效率。理论分析与实验结果均说明本文的算法具有较好的伸缩性与很高的查询执行效率。
其他文献
目前,互联网用户逐渐增多,网络业务流量也越来越复杂,持续增长的网络需求对网络的负载能力提出了非常严峻的挑战,因此网络拥塞问题变得日益严峻。网络拥塞控制对于网络系统的稳定
随着并行计算技术的发展,并行计算成为当今计算机科学中一个重要的研究领域。为追求不同的高性能计算目标,众多并行计算模型和并行处理器架构不断涌现。不断适应在全新的处理
企业的信息化技术和应用水平是提升企业核心竞争力,参与国际竞争的重要因素,而人力资源管理的信息化是其中关键的环节。人力资源已成为企业核心竞争力的战略性资源,因此人力资源管理是企业管理中的重要一环,而对人力资源进行信息化管理也成为了企业的必然要求。企业通过梳理自身的人力资源管理流程,建立符合自身业务流程的人力资源管理系统,使企业的人力资源达到最优配置,推动企业可持续稳定的发展。然而,人力资源管理是随着
物流的信息化建设和物流企业的业务流程重组,大大提高了企业的反应速度,降低了物流成本,并为企业带来了可观的经济效益。然而纵观全局,我国物流信息化水平不高,数据共享不够
信息化的发展,信息量的增加,促进了数据挖掘的产生和发展。数据挖掘技术现在已经在网络搜索、银行业等行业有了非常广泛地应用。数据挖掘相关的算法有很多,其中聚类分析相关
数字签名技术是信息安全理论与技术的基础和重要保证,它可以提供身份认证服务、数据完整性服务和不可否认服务。数字签名技术是密钥分配、电子银行、电子证券、电子商务和电
信息技术的飞速发展,手机通讯设备的流行,人类已经进入到了“读图时代”,图像视频数据已呈现爆炸式增长。由于图像具有简单生动,便于存储的优势,已被应用到很多领域中,但是这
学位
H.264是新一代视频压缩算法,正被越来越多的应用在视频服务方面,在手机、IPTV、视频点播、无线传输等领域已经有广泛的应用。因为H.264能提供更高的压缩比,同等条件下是MPEG-4的
学位