面向众核体系结构的宽度优先搜索算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:fems0601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
宽度优先搜索(Breadth-first Search,简称BFS)是一种基础的图形算法,是众多算法的核心组件,在大量领域中得到广泛应用,如网络安全、医学信息、数据挖掘、社交网络、语义网等等。宽度优先搜索算法还是一种典型的数据密集型应用,Graph 500即使用其对超级计算机处理数据密集型应用的能力进行排名。近年来,得益于较低的功耗和较高的性价比,众核体系结构的加速器在高性能计算领域得到广泛应用。MIC(Many Integreated Core)作为最新的众核体系结构协处理器,相对于其它加速器来说,具有和传统并行编程模型兼容的优势。随着采用CPU+MIC的“天河二号”登上Top 500榜首,MIC在高性能计算领域得到广泛重视。宽度优先搜索算法的并行实现具有数据竞争较严重、问题不规则和访存局部性差等特点,而MIC具有大量线程和宽向量处理能力且每线程的平均缓存较小,因而要充分发挥MIC硬件的优势高效实现宽度优先搜索,将面临线程间竞争开销较大,向量部件利用率不高,缓存利用率差等问题。本文即面向这些问题,研究利用MIC高效实现宽度优先搜索算法,主要取得了如下成果:1)设计并实现了自上向下和自下向上相结合的混合BFS算法。该算法根据图形的特点,在不同的搜索层使用不同的搜索策略,能够结合两种搜索策略的优势,性能分别为自上向下和自下向上策略的3.21和2.15倍。2)提出了一种面向MIC优化的多线程BFS算法。该算法以混合BFS算法为基础,通过减少数据竞争,消除原子操作,并采用动静相结合的线程调度方式,能够很好地利用MIC提供的大量线程处理能力。3)提出了一种使用宽向量部件进一步加速BFS的方法。该方法在自上向下搜索部分采用SIMD指令同时扫描顶点的邻居,在自下向上搜索部分采用SIMD指令并行查找未访问的顶点,能够进一步加速BFS算法,最高加速比达到1.85。4)设计并实现了CPU和MIC协同计算的异构混合BFS算法。该算法以混合BFS算法为基础,在搜索层中任务较多时采用CPU和MIC协同计算,通过比例可调的任务划分方法以及重叠计算的通信设计,解决了协同计算中任务不均衡和通信开销较大的问题,相对于CPU的加速比达到1.4倍左右。实验结果表明,本文在MIC中实现的BFS算法性能约为GPU的5.31倍;CPU+MIC异构混合算法的最高加速比达到1.46倍。
其他文献
本文通过研究WLAN相关标准以及基于身份的密码学,分别提出了无线局域网(WLAN)中基于身份的密钥协商与鉴别方案和使用Weil配对的WLAN安全方案,这两种新方案使用了不同的密码算法,但
软件仿真可以在宿主计算机上模拟目标计算机的运行,是一项应用广泛的技术,从新处理器和新体系结构的设计与验证到系统软件的开发与测试都有许多实例.在航天领域,仿真系统的使
在当今世界的通信领域中,GSM(Global System for Mobile communication)数字蜂窝无线网络仍然是占主导地位的移动通信系统,它为移动台之间以及移动台和固定电话网络之间提供
网络会议是现代社会高效交流通信的一种常用手段。对会议信息加密是为了确保网络会议安全而采取的必要措施。在迅速发展的Internet 世界,电子会议系统已成为一个研究的重要课
应用高通量基因芯片技术,使得我们可以从以往对单个基因的局部、片面性研究,上升到对整个基因组的全局、系统性的研究层面。基因表达谱数据挖掘面临检测数据高噪音、维数灾难、
本文重点研究实时流环境下的数字视频水印处理算法,并对所提出的算法在一个实时视频直播系统中作了具体的实现。论文主要的研究工作体现在如下几个方面深入探讨了数字流媒体的
移动互联网的不断成熟以及搭载各种传感器的智能终端的广泛普及和应用催生了一个全新的研究领域——移动群体感知技术领域。移动群体感知以具有感知能力的移动设备为载体,以
本文对网格环境中的事务处理做了深入的研究,给出了一种新的事务处理模型。文中使用的研究和开发平台是Globus Toolkit 3.0。 本文总结了网格和网格服务环境中的相关概念。
图像和视频中文本字符包含许多非常重要的有用的信息,如街道名称、商店名称、路标、交通标示、字幕等,这些信息对于图像和视频资料的自动注释、索引、压缩等方面重要的参考.
随着企业不断地成长,公司内部的作业流程更趋复杂,传统以人工处理流程传递之方式已不符合经济效益与企业需求,且由于近年来信息技术日新月异,因此许多企业纷纷朝向信息化与电子化