【摘 要】
:
近年来,图计算因其在解决实际问题中的广泛适用性而受到广泛关注。广度优先搜索算法是很多图分析算法,例如单一起点最短路径问题和中心度算法的基石。而在加速特定算法的运行速度,提高运行的能量效率方面,现场可编程逻辑门阵列(Fieldprogrammable Gate Array,FPGA)相比于CPU和GPU更有潜力。因此,在FPGA上加速广度优先搜索算法具有重要现实和学术意义。当前FPGA上的广度优先搜
论文部分内容阅读
近年来,图计算因其在解决实际问题中的广泛适用性而受到广泛关注。广度优先搜索算法是很多图分析算法,例如单一起点最短路径问题和中心度算法的基石。而在加速特定算法的运行速度,提高运行的能量效率方面,现场可编程逻辑门阵列(Fieldprogrammable Gate Array,FPGA)相比于CPU和GPU更有潜力。因此,在FPGA上加速广度优先搜索算法具有重要现实和学术意义。当前FPGA上的广度优先搜索算法计算硬件架构主要基于1~2个通道的动态随机存取存储器内存,计算能力受到内存带宽的限制,无法发挥FPGA的高并行度的硬件特点。ScalaBFS是一种面向广度优先搜索算法可扩展的新型加速器,它可以在带有高带宽内存的FPGA平台上随着内存通道的增加甚至卡的数量增加扩展广度优先搜索算法性能。通过利用高带宽内存带来的大量的带宽资源,ScalaBFS可以在U280加速卡上实现高并行度,高性能的单卡系统以及多卡系统。ScalaBFS的高并行度设计主要通过解耦合访存逻辑和计算逻辑来完成,两种逻辑单元之间由顶点调度器交叉网络连接。通过将顶点调度器的交叉网络移植到以太网上,ScalaBFS能够拓展到多卡系统。在单卡实验中,ScalaBFS可以随着内存通道的增加几乎以线性扩展广度优先搜索算法性能。在配置32计算单元和64高带宽内存通道的情况下,单卡ScalaBFS在真实图上可以达到最高19.7GTEPS的BFS性能。与Nvidia V100 GPU上的广度优先搜索算法Gunrock相比,ScalaBFS在稀疏图上的性能与GPU接近,但是性能功耗比是GPU的3~6倍。模拟的双卡实验表明,双卡ScalaBFS在较小(17%)的性能损失和资源占用相近情况下相比单卡可以实现更好的可扩展性和更大的图规模。
其他文献
短波红外成像技术具有隐蔽性好、环境适应性好、抗干扰能力强等优点,在军事、医疗、交通、工业以及农业等多个领域具有重要的应用价值。在非制冷短波红外成像中,传统的铟镓砷探测器占据了主要市场,但由于成本高、工艺复杂,其应用发展严重受限。而硫化铅(Pb S)胶体量子点(简称量子点)具有价格低、与CMOS工艺易兼容、响应波段可调、灵敏度高、填充因子高等优势,极有可能成为下一代短波红外的光敏材料。然而,作为一种
激光热丝焊接具有热输入小、能量利用率高、填丝效率高、间隙桥接能力好等优点,但仍面临因光丝间距波动造成的焊缝成形不佳和过程不稳等问题。将振荡扫描激光和热丝焊接有机结合,有望通过对熔池行为的调控改善上述问题,并进一步增加接头间隙桥接能力,提高其工业适应能力。为此本文以Q235低碳钢为对象,开展了扫描激光热丝焊接工艺研究。主要研究结果如下:首先对比了激光热丝焊接和冷丝焊接工艺特性,系统研究了焊接速度、送
近十几年来,多智能体系统的协调控制问题备受关注,并在无人机编队、卫星姿态对准和多机器人系统等领域具有广阔的应用前景。一致性作为多智能体系统协调控制的基础问题之一,主要目的是基于局部信息制定一些合适的控制协议,以保证所有智能体达到相同的状态。在多智能体系统的理论研究中,通常假设每个智能体具有充足的能量、良好的运算能力,且智能体间的通信是实时的。然而,在实际应用中,单个智能体的运算能力和通信能力依赖于
随着基于人脸图像的计算机视觉任务广泛应用于商业场景,人脸质量评估的重要性逐渐显现,与深度学习的结合使其更具备实用价值。通过设计合适的人脸质量评估指标评估人脸质量,不仅可以有效给出评价人脸质量的指导性意见,作为参考获取质量更佳的图像,还可以筛选高质量人脸,作为后续处理任务的有效输入图像。本文提出了一种多任务人脸图像质量评估算法,在评估人脸综合质量的同时,给出五种质量评估指标的指导性结果。本文选择CA
船舶火灾事故中约有七成发生在船舶机舱中。机舱内部空间大、环境复杂,火灾一旦发生会迅速蔓延且极难扑救,严重影响船员生命及财产安全。因此,研究一套能在机舱内尽早精确地检测出烟雾、火焰的方法对于船舶安全有着重要意义。基于视频的火灾识别算法具有监控范围大,检测精度高,不受空间、距离环境限制,易于保存数据等优点,但现有火灾识别算法多在一些专有数据集验证,对船舶机舱实际场景适应性不够,直接应用到船舶机舱存在识
是软件维护过程中的重要部分,为开发人员提供简洁易懂的解释说明。工业界软件开发项目中往往缺乏注释。代码摘要的自动生成技术可以减轻繁琐复杂的人工标注,释放更多优质劳动力。因此,研究代码摘要的自动生成技术对促进业界相关应用的发展具有重要意义和价值。领域仍然存在一些挑战:1.传统的序列到序列模型可以学习到源代码的序列表示,却难以学习代码的结构化语义信息;2.在传统代码摘要模型中,模型在训练过程中的目的是将
由于电网络造价昂贵,维护困难等因素,传统的集中式发电技术逐渐难以满足区域分布式多元化发展的需求。微电网作为一种分布式供电技术,可高效整合包括太阳能、燃料电池等多种清洁能源,因地制宜应用灵活,具有广阔的发展前景。但是,受外部环境和天气因素影响,风、光等可再生能源及非弹性负荷的不确定性变化给微电网的能量调度优化带来了巨大挑战。为此,本文以光伏发电单元、固体氧化物燃料电池(Solid Oxide Fue
党建引领既是推动乡村善治的前提,也是乡村治理显著优势的重要体现。党建引领具有保证乡村治理社会主义方向的政治优势,具有提升乡村治理体系和治理能力的功能性优势,具有保障乡村治理中人民主体地位的社会性优势。实践中,一些地方通过选派第一书记、强化党组织建设来引领乡村治理,显示出良好成效。党建引领乡村治理实践路径在于强化组织建设实现党建引领政治优势,构建党政复合治理体系实现党建引领功能优势,发挥党组织资源链
数字病理在信息管理、远程咨询、专家会诊、读片交流和实践教学等方面的应用,都依赖于清晰无损的玻片扫描图像。玻片扫描成像系统技术是数字病理创新发展的关键性技术,但是玻片扫描成像系统在将玻片数字化的过程中会因为离焦等问题,导致局部图像模糊,影响后续判读。因此,需要在病理玻片数字化之后,对全玻片扫描图像进行清晰度评价,找出其中模糊的局部图像块。由于主观评价方法费时费力;有参考评价方法因难以获得参考图像而受
在物联网实现万物互联的同时,海量数据的涌入给核心数据网络造成了巨大的压力,而且随着智能监控、自动驾驶等低延迟应用场景的出现,将数据传输到远端云服务中心会造成极大的传输延迟,无法满足实时性的需求。边缘计算作为云计算的扩展,通过任务卸载将部分任务转移至边缘执行,减少流向云中心数据量的同时降低了数据的传输延迟。而边缘设备性能不一、资源有限,如何合理进行任务卸载调度是一个重要的研究方向。现有的边缘任务卸载