基于GPU的并行图算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yinxiaomei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形处理器(GPU:Graphics Processing Unit)传统上是作为一种外设用来加速3D图形渲染,但随着其功能和性能的逐步加强,如今它已经成为一种流行的通用计算设备。随着CPU单核心性能的进化陷入瓶颈,同时多核CPU正在蓬勃发展,需要把注意力从单线程程序转移到多线程程序上,才能从多核CPU中获益。这就要求开发者必须设计相应的并行算法来代替串行算法。现代GPU将多核处理器的设计思路推向了极致,在一块芯片上集成了成百上千个核心。与CPU相比,GPU具有高性能、高能耗比、低成本等优势,因此利用GPU来提升算法性能得到了广泛的关注。  然而,GPU有自己独特的编程方式和算法设计思想,让习惯编写CPU程序的人很容易犯错,写出低效的GPU程序。因此需要深入研究GPU全新的编程模型,包括硬件结构、编程环境、程序执行方式以及性能优化方法等,对它们的深入研究和理解是设计高性能GPU算法的基础。在此基础上,高效实现了需要在后续算法中使用到的reduce、scan等原语操作,这些操作对于所提出算法的性能表现有至关重要的影响。  图算法的大数据量、高并发度和高性能要求的特点使其很适合利用GPU进行处理,因此近几年来基于GPU的图算法研究成为了一个热点。广度优先搜索(BFS:Breadth-First Search)是最底层最基础的图算法之一,它一般作为其他复杂算法的构成单元,其性能对整个算法会产生重大影响,因此值得进行深入研究。现有的GPU BFS算法均存在较大的负载不均问题,导致算法的性能受图结构的影响较大,表现不够稳定。针对此问题提出了一个新的BFS算法,第一次实现了完全的负载均衡。该算法将每一轮BFS循环分解为两个阶段:工作重分配与邻接顶点获取。工作重分配阶段使用一个并行化的expand操作来从全局范围内重新组织输入的工作负载,然后邻接顶点获取阶段以负载均衡的方式实现对邻接顶点的并行访问。实验结果表明,对比CPU上的串行BFS实现与现有最高效的GPU BFS实现,所提出的算法分别能够取得最高39倍和1.42倍的性能提升。  强连通分量(SCC:Strongly Connected Component)分解是另一个基础图算法。现有的GPU SCC分解算法基本上是CPU算法的直接移植,没有充分考虑GPU的架构特性,性能表现受到很大局限。针对这一问题,提出了一个新的SCC分解算法。它完全基于GPU架构,以前向和反向可达集合查询为基础,通过一种迭代形式的分治策略来识别每一个SCC。算法中引入了很多专门针对GPU架构所设计的优化方法,如基于BFS的高效多起点可达集合查询、可有效降低递归深度的Partition操作、高效的随机顶点选取方法、最优化的子图编号策略和顶点标记策略等。实验结果表明,对于CPU上最高效的Tarjan串行算法和现有的GPU算法,所提出的方法分别能够取得最高41倍和3.8倍的速度提升。
其他文献
电子商务的飞速发展,对商务活动过程的网络化要求更加迫切,要求使用电子合同的呼声也越来越高。本文从电子合同的法律效力问题开篇,指出电子合同的可靠性和安全性问题,然后针对这
计算机网络病毒大规模爆发时所带来的巨大网络流量对网络的正常运行构成了严重威胁,而且网络病毒同黑客攻击相结合将会导致更加严重的危害。现有的计算机病毒防治技术主要关注
近年来,随着便携式计算机和掌上型电脑的日益普及,以及无线通信技术的迅速发展,对“无论何时,无论何地”的个人通信提出了迫切的需求。新的网络环境和新的应用需求引起了对可及时
遥感图像分类是遥感图像处理研究领域中的一项主要内容,分类的精度直接影响遥感数据的应用水平和实用价值。如何解决多类别地物的识别并满足一定的精度,是遥感图像研究中的一个
半导体存储器是众多芯片家族之中的重要一支。现在数字设计的硅片中,近80%面积用于存储芯片。在今天高性能微处理器中一半以上的晶体管用于高速缓存(cache),并且预期这一比例
二十世纪九十年代以来,随着运动捕获技术的广泛应用,运动捕获数据可以直接得到,导致大规模运动数据库的不断建立,需要一种有效的运动捕获数据关键帧提取及检索技术对运动数据
随着计算机和网络技术的不断发展,Internet已经成为人们生产和生活中的不可缺少的组成部分。社会的各个领域都在努力利用现有技术建立网络化的应用体系,进而实现信息交互和资
随着信息技术的不断突破和快速发展,现代社会产生的各种信息数据呈指数级增长。在大数据时代来临之际,人们对存储系统的要求也越来越高,希望系统能够提供高性能、低能耗、高可靠
人眼是人获取外界信息的主要渠道,研究如何利用人眼获取视觉信息进行研究具有重要意义。当前,人们主要使用眼动跟踪技术对其进行研究,眼动跟踪技术应用广泛,其在医学、心理学
无线通信技术和计算机网络技术的发展为移动自组网络的产生奠定了基础。由于具有不需要集中式的网络管理和基础设施的显著特点,移动自组网络,即无线Ad Hoc网络,在近年来受到越来