【摘 要】
:
为了有效提升列数据库的查询性能,充分利用异构计算平台的计算资源,本文在一套已定义的列数据库原语集合的基础上,提出一套原语调度方法。该方法包括原语执行机制,基于动态规划的CPU原语调度方法和基于GPU显存管理机制的GPU原语调度方法。通过对TPC-H基准程序中几个典型查询进行测试,结果表示CPU原语调度方法使查询更稳定,GPU原语调度方法使得查询更快。
【机 构】
:
School of Software Engineering, South China University of Technology, Guangzhou 510006, China
论文部分内容阅读
为了有效提升列数据库的查询性能,充分利用异构计算平台的计算资源,本文在一套已定义的列数据库原语集合的基础上,提出一套原语调度方法。该方法包括原语执行机制,基于动态规划的CPU原语调度方法和基于GPU显存管理机制的GPU原语调度方法。通过对TPC-H基准程序中几个典型查询进行测试,结果表示CPU原语调度方法使查询更稳定,GPU原语调度方法使得查询更快。
其他文献
高性能计算是支撑国家实力持续发展的关键技术之一。论文首先分析高性能计算面临的问题,指出传统高性能计算程序性能优化技术的不足。接着介绍了面向高性能计算程序性能优化的新方法—迭代编译优化。迭代编译优化作为提高机器实用性能的有效手段,对高性能计算至关重要,迭代编译优化技术的研究逐渐成为高性能计算领域的研究热点。最后给出了总结,并针对迭代编译优化开销较大这一问题给出了未来工作方向。
本文说明了如何利用三维并行自适应有限元软件包PHG求解生物分子溶液体系的非线性Poisson-Boltzmann方程及电扩散方程,并介绍了一种解决这类问题的新方法,它将网格生成与自适应计算过程结合在一起,可自动产生合适的网格,避免复杂的曲面网格生成步骤。之前的网格生成工作按照:(1) TMSmesh生成高斯曲面的三角网格; (2) TransforMesh删除自相交的三角网格; (3) ISO2M
单机运行环境难以满足海量空间数据的连接聚集操作对时空开销的需求,集群上的并行计算是高效处理海量空间数据的连接聚集操作的关键。Map-Reduce是云计算中—种应用于大规模集群进行大规模数据处理的分布式并行编程模型,作者分析发现Map-Reduce并不直接支持以既高效又自然的方式来处理具有二次归约特征的并行空间连接聚集操作.因此,提出了—种新的并行计算模型—Map-Reduce-Combine(MR
嵌入式存储体目前已经广泛用于芯片设计,对于很多芯片而言,片上存储体是影响芯片成品率的主要因素,在某芯片内集成了大量的定制存储体D_MM,本文采用内建自修复和存储体冗余技术实现对该存储体的在线测试与修复,两者紧密结合满足了很高的设计频率指标要求,并且能够对MBISR电路进行有效的功耗控制。
在列数据库中,连接操作依然是最核心和最耗时的操作,GPU 强大的计算能力可为此提供新的优化手段.基于Fermi 架构,文中提出了新的Hash Join 算法和Sort-merge Join 算法,基本思想是充分利用该架构新增的缓存结构,减少连接操作的cache缺失率.在此基础上,采用CUDA stream 技术,在输出结果较多时可以有效隐藏主存与显存间数据传输带来的延迟,进一步提升算法的执行效率.
Web服务非功能属性评估是服务选择的重要前提,而目前的服务评估方法没有根据各非功能属性内在特征进行其属性值的评估,也没有考虑用户对多个属性的复杂需求,无法有效的选择出真正满足用户需求的最佳服务。本文从用户角度出发,提出了基于用户的Web服务FRC评估选择模型,模型考虑了用户对各个属性的需求,并根据非功能属性隶属的不同数学性质,将隶属度的概念、模糊评判理论、概率统计方法和TOPSIS多属性决策法应用
SimK 是由中科院计算所体系结构国家重点实验室开发的一个并行离散时间模拟引擎.基于已经发布的SimK 1.0 版本,对任务划分及同步推进阻塞控制进行了功能扩展,开发了SimK 的1.1 版本.同时由于缺乏一个专门对SimK 模拟性能评测的Benchmark 以及全面的评测结果,首先讨论了并行模拟引擎Benchmark设计准则,之和介绍开发的Benchmark-PassBall,并且使用它对Sim
云环境中,借助瘦客户端技术提供软件远程执行服务成为解决移动终端资源局限性问题的有效途径.但移动网及广域网的固有延迟会严重影响交互应用程序远程执行的用户体验.本文引入与移动终端距离更近的小规模云基站CloudAP,建立一种面向移动终端的“云中心+云基站”两级软件高效远程执行体系结构,同时提出了CloudAP环境下弹性软件包副本放置策略,软件包副本总是向着请求的方向移动.实验结果表明,借助于云基站Cl
水泥图像特征提取是水泥建模的重要基础。传统的水泥特征提取在处理大量水泥图像时耗时巨大,且需要大量内存资源。考虑到基于像素的图像特征提取有着可并行化程度高的特点,结合实验室现有资源,本文提出了分布式网络内采用GPU(图形处理器)作为计算平台的基于CUDA(基于统一设备架构)的特征提取方法。基于CUDA 架构的GPU 图像特征提取为处理海量水泥图像提供了一种新的思路。
硅酸盐水泥水化反应的极端复杂性使得人工推导水化动力学方程的研究存在很高的难度。通过进化计算方法可以从观测到的硅酸盐水泥水化程度时间序列数据中自动萃取出水化动力学方程,然而其时间复杂度很高。因此,本文利用CUDA 计算架构对进化过程进行并行加速来减少运算时间。实验结果表明,采用CUDA 架构可以获得较高的加速比,所得到的动力学方程可以很好的吻合观测到的水化程度时间序列数据。