达梦数据库哈希连接算法的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kingtigerzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连接操作是基本的关系数据库查询操作之一,是从两个不同的关系中检索满足条件的信息。实现连接的方法较多,其中哈希连接在所有的连接算法中被证实是性能最好的,但现有的哈希连接都存在分区溢出问题。如果连接过程中发生分区溢出现象,会严重降低算法效率。研究并改进现有的哈希连接算法对提高哈希连接效率具有重要意义。为了解决现有哈希算法分区溢出的缺点,使用归并连接思想对现有的哈希连接算法进行了改进,设计了一种哈希归并连接(Hash Merge Join, HMJ)算法。该算法分成两个阶段:哈希阶段和归并阶段。哈希阶段利用哈希表的哈希值作为数据对比键值,对哈希表中所有数据进行排序,把整个哈希表中的数据当作一个分区,然后依次对所有数据进行类似处理,使得数据基于哈希值和原始键值有序;归并阶段则对排好序的数据进行归并连接,完成整个连接操作。测试结果证明,该算法不会产生分区溢出。根据达梦数据库管理系统中的操作符特点,以哈希归并连接算法为基础,设计并实现了哈希内连接、外连接和半连接操作符,实现过程中临时数据的存储采用列存储技术,归并操作采用败者树算法对数据进行排序。通过对使用新算法实现的哈希连接进行测试,结果证明,不论是内连接、外连接还是半连接,哈希归并连接算法较以前算法在性能上均有较大提高。
其他文献
数据库中储存着大多数机构赖以生存的重要信息,是信息系统的核心和基础,因此数据库的安全性越来越受到人们的重视。目前,大部分都采用了一定的安全保护措施来保护数据库的安
随着无线通信技术、低功耗传感器技术和嵌入式系统技术的快速发展,无线传感网成为一种全方位采集感应信息和处理数据的技术,它正在影响和改变我们的生活。在监测区域内部署大
椭圆曲线密码(ECC,Elliptic Curve Cryptography)是一种杰出的公钥密码体制,但在实现时仍有一些关键的问题需要进一步研究。由于标量乘法的效率决定了 ECC的实现效率,因此标
RAID系统在架构上,采用多层次、多模块的设计,模块之间采用异步机制,并使用队列来缓存交换数据。在技术上,磁盘阵列引入了冗余技术以提高系统的性能和可靠性。这些给系统的多个模
随着电子阅读时代的到来,现有电子阅读设备与应用通过屏幕印刷、文档解析排版等技术为用户提供了与纸质书不相上下的良好阅读体验。随着对用户需求的深入研究,以及对阅读工具的
计算机网络技术的迅猛发展,使得网络协议日趋多样和复杂,协议的开发也面临着越来越多的挑战。协议一致性测试是为了验证协议实现与相应的协议标准之间的一致性,是确保各种计
计算机软件在快速发展给人们带来方便,但同时由于软件规模日趋庞大、形态日趋复杂,而使得许多软件本身的可信性变得越来越脆弱。传统的软件工程方法已经无法满足当今社会对软
随着移动机器人相关关键技术的不断突破,以及我国航空航天、探险救援、消防排爆、核能工业等众多领域的快速发展,迫切需要一种能在野外环境和复杂地形(如矿难现场、地震废墟)
在过去的30年,用于城市地面交通工具中自动驾驶技术的开发已经得到了飞速的发展。目前,现代自主驾驶车辆已具备一定感知车辆周围环境的能力,比如根椐分类所分析对象的类型并进行
信息安全一直以来就在信息科学中占据着重要的角色。当今社会,随着信息时代的到来,特别是网络环境的日益普及,人们越来越关注信息在传输过程和存储过程中的安全性。信息安全