列式内存数据库的自组织元组重构方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sophia_je
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库中数据量越来越大,性能问题变成前所未有的重要。列式数据库以加载速度快、只读取相关属性列、高压缩比等特点在数据分析领域得到广泛的应用。但列式数据库的存储方式又导致其在进行多维度查询等操作中必须用到多列数据的连接构成输出元组,即元组的重构。元组的重构是列式数据库中最耗时的步骤,因此,元组的重构一直是列式数据库研究的热门话题。部分边路划分(Partial Sideways Cracking)作为一种列式数据库的自组织的元组重构方式,不但具有调整代价小的特点,而且根据工作负载进行持续增量的自我调整的特点能很好的满足日益复杂多变的工作环境。但是现有的边路划分仅仅是盲目的根据查询范围对数据库进行调整,这种盲目的调整往往需要付出较高的调整代价,但效果却不是很理想。本课题基于部分边路划分提出了SR部分边路划分(Sorted Robust Partial Sideways Cracking),使得自组织元组重构不但更具有鲁棒性、节省内存,而且进一步提高了自组织元组重构的速度。本课题主要完成的工作有以下几个方面:(1)研究和分析了部分边路划分在自组织元组重构所遇到的问题,并通过实验分析了部分边路划分在不同工作负载下所产生的鲁棒性问题以及对齐操作的代价问题;(2)基于部分边路划分,针对部分边路划分分析所遇到的鲁棒性问题和对齐操作代价问题,提出了SR部分边路划分技术,并通过实验证明了其鲁棒性以及算法优越性;(3)实现了一个基于SR部分边路划分的范围查询数据库系统,为以后的基于SR部分边路划分研究奠定了基础。
其他文献
光并行计算具有时延的精确性、极高的传输速度、高带宽、高可靠性,能够同时处理大量的数据等特点。本文主要研究光并行计算在数字图像信号处理和计算分子生物学中的应用。我
随着网络用户数量的不断庞大,对于那些热门数据,以由点到面的形式进行内容的高效分发已越来越受到人们的重视。单向广播网络(如有线电视CATV网络)是天然的内容分发的广播网络,如
本文通过分析XML数据模型的特点,针对传统数据集成系统中存在的问题,设计了一个基于XML的异构数据集成系统—XHDIS,并对其中的关键技术进行了较为深入的探讨和研究,具体内容如
区域经济是国家经济的重要组成部分,经济全球化已使得单个企业的竞争发展成为区域企业群的竞争。利用信息技术促进制造业的资源优化利用、提高创新开发水平、发挥区域优势促使
  本文在研究基于移动代理的入侵检测技术的基础上,深入学习研究了目前新兴的蜜罐技术,在所参与的国家863项目“基于智能移动Agent的空间信息网分布式实时入侵检测及预警系统
本篇论文从网格发展的现状谈起,提出了建立基于自治计算元素的、面向服务的网格化组织与管理体制,去自动实现网格服务的共享组织和协作调度.研究工作分为两部分,主要是软件Ag
语义特征造型系统采用完全语义约束定义特征和构建模型,能够全面地满足工程设计人员的各种意图,但是它较之以前的基于参数,基于历程的特征造型要复杂得多。它在底层采用特征
  移动代理描绘了一种新的通讯模式,近来它也受到了研究人员和专业人员的格外关注,然而,尽管移动代理的安全性被普遍认为是非常重要的一点,但仍没能以令人满意的方式解决这个问
形状是物体的本质特征之一,利用形状特征进行检索可提高检索的准确性和效率。因此本文主要针对基于形状的图像检索技术中存在的问题,对小波分析技术及其在基于形状的图像检索
随着核工业的快速发展,放射性材料的广泛应用,β射线监测引起了社会的广泛关注和高度重视。目前的β射线监测主要采用有线技术,覆盖范围小、传输距离有限、维护困难、布线复杂。