基于机群架构的并行数据库实现技术研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:dingzhiyoulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
各种高科技领域的强劲需求不断推动着数据库规模的迅速膨胀,传统的集中式数据库系统已经难以满足这种数据密集型应用的需要,因此,开发高性能、低成本的并行数据库系统将有重大意义。   本文主要探讨了在分布式存储的多机系统上设计和实现可扩展的并行关系数据库系统的技术。这一设计思路主要基于以下事实:第一,分布式存储的多机系统比单机系统和共享存储的多机系统具有更快的响应时间、更好的可扩展性、更高的性价比,应用非常广泛;第二,关系数据库管理系统(RDBMS)在当今数据库市场上仍然占据统治地位,关系代数作为关系查询的基础,被认为是最适合实现并行处理的;第三,关系数据库可以高效的执行任何用说明式查询语言表示的查询。   我们基于机群架构实现了一个并行查询原型系统ParaMidSQL(ParallelMiddleware forSQL)。首先,我们描述了该原型系统的总体架构,然后介绍了全局字典的设计方法,最后详细讨论了并行算法库的设计和实现。在设计并行算法库时,考虑了两种不同的实现方法:其一是“基于数据划分”的方法,它采用“分而治之”的策略来实现并行查询,其二是“基于并行操作算法”的方法,它采用数据交换与查询操作重叠进行的策略来隐藏通信开销。前者实现简单,但是性能表现欠佳,后者性能优异,但是实现起来比较复杂。   在四结点SMP机群上对原型系统进行了性能测试。测试结果表明:ParaMidSQL对数据库查询的基本操作(暂不考虑更新操作)较串行MySQL有显著的加速,选择、排序、连接的平均加速比分别为2.62(3个结点)、3.41(4个结点)、2.93(4个结点)。
其他文献
矩阵计算在科学计算和其它很多的领域中有着广泛的应用。LAPACK是一款线性代数函数库,它实现了线性代数计算中的大部分操作,包括矩阵分解、线性方程求解、最小二乘问题和矩阵特
学位
目前部分国内企业已经建立起一系列计算机应用系统,在运营过程中这些系统暴露出一些问题,如这些系统彼此孤立、互操作性差,数据难以得到综合分析和利用,缺乏动态捕捉市场机会、及
学位
学位
目前基于UWB(超宽带技术)的短距无线通信中,其国际标准协议IEEE 802.15.3a仅涉及到微微网(piconet)内的通信,范围局限于单个微微网和有限的设备之间.这样的网络结构显然无法
JNDI服务是Web应用服务器的核心支撑服务,在中间件系统平台中处于非常重要的地位。本文从分析Web应用服务器对于名字服务的需求和现有JNDI服务的不足入手,在J2EE1.4规范的基础
学位
A管理模式是我国较先进的企业管理思想,在很多企业得到了实施并取得良好效果。但管理过程中的数据搜集分析和过程流转等业务功能,必须依靠软件系统的支撑才能够取得实质效果。
学位
近年来,形式化方法——即在计算机系统和软件的规范、设计和构造中使用基于数学模型和离散数学的技术的工具的方法,被广泛应用于高等级安全操作系统的开发过程中。TCSEC的B2级
学位
科学数据库经过二十多年的发展,积累了大量的数据资源。随着网络技术的发展和科学研究的进步,科学数据库将成为科研工作的基础设施之一,并将成为未来科学研究必不可缺的资源。作
学位
在大脑接收的来自外部世界的感知信息中,80﹪以上是通过视觉系统进行加工处理的.最近二十多年来,视觉信息加工的机制是脑科学、神经生物学、认知心理学和计算机科学等学科研究
嵌入式技术作为计算机技术和电子通讯技术的交叉学科,其在科学研究、工程设计、军事技术等领域得到了广泛的应用。在一般情况下,嵌入式应用的执行都有着相当严格的时间限制,有些
学位