Xeon Phi众核处理器上BFS算法的优化技术

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ww5118529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是一种表达能力很强的数据结构,它可以表示现实世界中对象和对象之间的关系,如城市与城市间的道路连接、人之间的血缘关系。许多问题都可以用图表示再通过图算法解决。图和图算法在社交网络、基因分析等领域有着广泛应用,随着图数据规模的高速增长,如何高效处理图数据已经成为研究热点。广度优先搜索(Breadth-first search,BFS)算法是一种具有代表性的图搜索算法,Graph500测试程序使用它来评测计算机系统运行大数据应用的能力,研究它的优化技术可以为其它图算法的优化提供借鉴。为了研究BFS算法在Xeon Phi众核处理器上的优化技术,本文在新一代Xeon Phi众核处理器(KNL)上结合硬件特性对广度优先搜索算法进行优化。主要研究工作和成果如下:1.提出了一种针对KNL的片上网络对BFS算法进行优化的方法。KNL与前几代产品不同,它的处理器核通过二维片上网络进行互联,该网络具有多种不同工作模式。本文提出了针对该网络对BFS算法进行优化的方法,有效提高了BFS算法的性能。2.设计实现了一个针对KNL的特点深度优化的混合BFS算法。在针对片上网络进行优化的基础上,还从两个方面对混合BFS算法进行进一步优化:a.向量化搜索。KNL众核处理器所配备的高级向量指令集扩展提供了一次处理512bit数据的能力。为充分利用BFS算法的并行性,提出在广度优先搜索算法的自底向上搜索阶段使用向量指令并行搜索边表,进一步发掘并行性;b.对输入数据进行预处理以减少工作量。对图的顶点进行重新编号删除孤立顶点,减小位图数据结构的大小,减少了搜索时遍历位图的工作量;对邻接点列表进行排序,减少了边检查次数。实验结果表明,本文提出的针对片上网络进行优化的方法可以有效提高BFS算法的性能。在此基础上结合硬件特性进行深度优化的混合BFS算法具有优秀的性能,可以作为其它图算法的组成模块,具有实用价值。
其他文献
雷达起源于第一次世界大战时期,最初的目的是探测空中金属物体,随着时代的发展,微电子等各个领域科学的进步,随着雷达技术不断发展,雷达系统已经变为未来战场上的信息指挥核
在获取肺部图像的过程中,受医疗设备或者环境因素的影响,导致肺部图像的纹理细节信息模糊、对比度低、肺部组织结构和背景之间的边界不明确并且含有噪声,这些特点使得在检测
3D-MIMO技术属于5G技术,现阶段属于5G技术4.5G化,核心是大规模天线的运用。自从4G TD-LTE标准形成以来,MIMO一直是关键技术,这种多天线技术一直受到极力的推崇。在TD-LTE空口
土地是人类赖以生存和发展的重要资源,当前形势下,实施土地开发是我国实现“提土地利用率和利用效益,实现耕地总量动态平衡和持续土地利用”的重要手段。实施土地开发,尤其作
随着微机电(micro electromechanical system,MEMS)惯性传感器精度的逐步提高,基于MEMS惯性传感器实现高精度行人导航定位成为可能。此类系统具有成本低、易携带、抗干扰能力
随着人口老龄化的日益加剧和下肢瘫痪者的逐渐增多,为解决他们在屋内的移动问题,坐垫机器人得到了应用。由于坐垫机器人工作于狭窄复杂的环境中,为了避免反复驱动和保证使用
波分复用光网络由于采用固定不变的波长通道间隔、信号速率、调制格式等,导致其网络资源利用率较低,难以满足用户对网络资源效率的要求。为了适应用户对不同粒度的带宽需求,
深空通信,指地球上的通信实体与处于深空的飞行器之间的通信[1]。为了实现地球和宇宙行星之间数据的可靠传输,需要研究和开发通用的数据交换网络架构。延迟/中断可容忍网络(D
由于无线传感器网络具有普及性、易用性、价格低廉等特征,如今在许多工业和科研中得到越来越多的应用。目前国内主要通过自动气象站来监测各种气象要素,但是由于其建设成本昂
高分辨率卫星信息产品科教服务平台简称高分科教服务平台是“高分辨率对地观测重大专项的子课题”之一,其目标是面向科研单位、高校遥感应用研究和行业应用研究。该平台具有