并行数据库查询优化的遗传算法

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:hgjsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询优化是并行数据库系统的核心技术。目前,查询优化的研究主要围绕着具有多个连接操作的复杂关系数据库查询的优化问题进行。近十几年来,人们对于并行数据库中的多连接查询优化问题,已经进行了广泛的研究。然而,目前在基于机群并行计算环境的多连接查询的优化算法的研究工作还很少。本文重点研究了基于机群并行数据库中关系的存储分布、多连接查询优化和查询处理等关键技术。 机群并行计算机系统是并行处理技术的一个重要分支,是进行高性能计算的一个有效途径,必将主宰并行计算技术的发展。本文在借鉴了机群并行数据库系统特点的基础上,提出了关系分布算法、多连接查询优化算法和查询处理方法。 机群系统中,网络通信的带宽一直是系统的瓶颈,处理机间的数据交换会大大的增加连接操作执行的时间开销。本文提出的关系分布算法,在选择关系的分布属性、分布方式和处理机集合时,充分考虑了机群系统中引起数据重分布的因素,减少了额外的通信开销;同时兼顾了并行系统中的算子内并行、算子间并行和流水线并行等多种并行,便于开发机群系统的并行性。 多连接查询的优化问题是并行查询优化的关键问题之一。本文算法针对机群并行数据库系统的特点,研究了资源分配在查询执行代价估算中的作用和方法,提高了查询计划代价计算的精度,保证了优化结果的质量。与此同时,为了节省网络通信的开销,算法的代价模型计算将网络的通信代价考虑在内,充分利用了查询中各关系的物理存储信息,减小了不必要的通信开销。 中文摘要百亩亩亩..亩困.口百.百亩口口 在并行查询处理方面,本文基于分布式组件对象模型,实现了并行数据库查询处理的数据重分布算法、连接算法和流水线执行算法等查询处理算法以及并行查询计划的调度执行算法,开发了并行数据库的三种并行,提高了多连接查询的执行效率。 在实验部分,通过对荃于最小中间结果的贪心算法、基于右深树的启发式算法和本文提出的算法的模拟实验,对比了三种算法的性能。实验结果表明,算法较大的提高了机群系统中多连接查询优化的效率,是解决多连接查询优化的有效途径,对提高并行数据库的性能起到重要作用。
其他文献
个性化虚拟人三维建模是在虚拟场景中建立用户个性化的三维几何模型。本文使用多台微软推出的Kinect深度摄像机完成个性化人体的重建,工作流程如下:首先,根据Kinect相机特点
随着嵌入式系统复杂性的增长,嵌入式系统的开发一般需要在操作系统的基础上进行。硬件平台的多样性是嵌入式系统的主要特点,如何使嵌入式操作系统在不同的硬件平台上有效地运
针对目前Web挖掘和个性化技术的需求及研究现状,该文将研究重点放在支持个性化推荐的Web挖掘若干关键技术的研究上面,提出了一些应用于个性化推荐的Web挖掘新的算法,研究了几
本文设计和实现了基于智能卡的安全控制系统,它从网络安全和计算机安全两个方面入手保护计算机系统的安全。在网络安全方面,本文研究了已有防火墙的体系结构和关键技术,提出利用
本文对文档分类和聚类方法及其在信息检索中的应用进行了深入研究,主要包括以下几个方面的内容:通过对当前分类方法的分析,提出了基于统计的文档层次分类方法.针对当前文档聚
计算机应用的普及、多媒体技术的发展、教育体制的改革是的多媒体教学软件有了很大的市场。但当前市场上的多媒体教学软件质量很难让用户满意。如何在进度范围内制作出高质量
随着Internet的商业化,各种网络产品和网络应用相继出现,加速了IPv4地址的消耗,IPv6在这种情况下应运而生。IPv6在全球越来越受到重视,相应的网络产品和应用也大批涌现,从而
数据挖掘技术是从上个世纪80年代开始发展起来的一门新技术,其主要的目的就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道
随着计算机网络及其应用的快速发展,网络上出现了越来越多的网络平台、应用,用户在不同的平台、应用可能会使用大量的虚拟身份应用信息。不论是静态数据如注册账号,还是用户
随着Internet规模的不断扩大,IP地址不足的问题日益突出。网络地址转换(NAT)技术作为缓解IP地址紧张的一种办法,不仅可以大大提高IP地址的复用率,还能够有效增强局域网的网络安