前缀立方的结构化索引

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jerklie198091
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
前缀立方是最近提出的一种数据立方结构,它利用前缀共享和基本单元技术,在浓缩数据立方的基础上进一步消除了数据小方内的前缀冗余,从而进一步减小了数据立方的尺寸。由于对数据立方的任一范围查询事实上均可最终归结为针对其中特定数据小方的范围查询,所以前缀立方仍然按数据小方聚簇,在每一个数据小方内,立方元组按照共享维值进行聚簇,并且通过共享前缀形成分组结构。由于分组结构的存在,前缀立方不能沿用浓缩数据立方的索引,必须为它寻求一种新的索引机制。研究工作者最近提出了前缀立方的一种索引机制Prefix-CuboidTree。它结合C-曲线和B-Tree索引结构成功地对前缀立方进行索引。该索引范围查询算法采用深度优先的策略,通过查询点跳跃减少了I/O代价。现实世界中的数据往往都是非均匀分布的,所以在整个数据空间中大部分空间是未为利用的死区。怎样避免对死区的查询成为提升索引的查询性能至关重要的问题之一。而Prefix-CuboidTree并没有考虑到这个问题,因此,基于BUB-Tree和R-Tree索引技术得到了前缀立方的一种新的索引机制Bound-CuboidTree。它在每个数据小方内以Z-顺序保持分组的空间临近性,然后使用BUB-Tree对每个数据小方进行索引,减少了范围查询时的死区,提高了查询效率。同时参考R-Tree生长机制,通过选取插入后索引节点表示范围的增量最少的那个索引节点进行插入,成功解决了BUB-Tree不能在索引节点的Z-曲线编码范围是连续且不相交的情况下使用的问题。在此基础上提出了这种索引的广度优先策略的范围查询算法,避免了因为Prefix-CuboidTree因为误中而产生的I/O代价。实验结果表明:Bound-CuboidTree在大多数情况下要比Prefix-CuboidTree性能更好,更适合前缀立方的结构。
其他文献
软件再工程作为能够增进对现有软件的理解,改进软件自身质量以提高其可维护性、可复用性和可演化性的一类活动,在软件工业中占据了越来越重要的地位。通过软件再工程,可以发掘出
微波遥感是继可见光和红外遥感之后发展起来的遥感技术,其本质特点是它的工作频率。雷达高度计作为一种重要的有源微波遥感器,能够提供海面高度、有效波高和后向散射系数等测量
模式分类是许多工程领域如自控监测、图像识别、故障诊断、物料配制、医疗诊断等领域广泛应用的一种关键技术。经典的模式分类方法主要是基于多元统计分析方法,近年来人工神
随着计算机技术和网络技术的发展,网络上的信息资源呈现出爆炸性增长趋势,越来越多的信息被数据化,如何有效地存储这些不断膨胀的数据并且能快速方便的检索是网络存储技术面临的
作为一种新兴技术,对等网络(Peer-to-Peer,即P2P)技术近年来飞速发展,已经越来越多的应用于各种服务中。其中,基于对等网络的流媒体直播服务是时下应用需求发展最为迅速的一
日前,人们对计算能力、软件服务质量以及大规模数据量的处理要求越来越高,而现有的计算能力不能满足这些需要,于是云计算得以提出。云计算发展到今天,不论是在学术界还是在商业领
数字水印技术作为信息隐藏技术的一个重要分支,是目前信息安全领域的前沿课题,在数字作品版权保护和多媒体完整性认证领域方面发挥至关重要的作用。数字水印涉及到通信与信息理
网格是近年来发展起来的新兴技术,并已成为越来越重要的研究领域。在各个行业的应用中,也越来越广泛。在使用中,网格安全问题是网格计算中的一个核心问题,对网格安全问题的研
语音识别拥有可观的应用前景,尤其在我们生活信息化越来越加深的今天,应用于Web的语音识别技术作为一个语音识别应用的热点方向,也具有深远广阔的应用前景。本文重点集中讨论
基于校园网的学校内部各管理信息系统的数据共享和交换是学校信息化建设的重要工作。要从根本上解决学校信息系统集成中由于各个子系统的数据格式不一致,难以集成的问题,关键还