【摘 要】
:
基于蒙特卡罗方法的随机游走(Random Walk)算法是图计算领域非常重要的基础方法之一,被广泛应用在图节点相似度计算、网页排名、图像分割、机器学习预处理等任务中。随机游走路径采样的独立性使得其具有天然的高并行性的优点。同时,随机游走过程中充满了大量的随机访存,因此内存访问开销较大,是一种访存密集型的算法。但是现有的计算平台如GPU、CPU等,由于其硬件特性以及内存调度机制,很难提供随机游走算法
论文部分内容阅读
基于蒙特卡罗方法的随机游走(Random Walk)算法是图计算领域非常重要的基础方法之一,被广泛应用在图节点相似度计算、网页排名、图像分割、机器学习预处理等任务中。随机游走路径采样的独立性使得其具有天然的高并行性的优点。同时,随机游走过程中充满了大量的随机访存,因此内存访问开销较大,是一种访存密集型的算法。但是现有的计算平台如GPU、CPU等,由于其硬件特性以及内存调度机制,很难提供随机游走算法的高效计算。而在图计算领域,Field Programmable Gate Array(FPGA)由于其可配置、低功耗、高并行、流水线等特点被广泛应用,在不规则的图数据计算上带来了很好的加速效果。而目前还没有在FPGA上进行随机游走算法部署及加速的工作,缺乏相应的系统设计。为了提升随机游走的计算效率,本文提出了一种基于FPGA的Random Walk算法加速系统。系统主要分为CPU端主控系统及FPGA随机游走加速器两部分。本文充分利用了CPU与FPGA各自的优势,借助PCIE接口提供的高带宽通信,组建了CPU-FPGA协同计算框架。本文通过将随机游走计算及缓存单元部署到访存延迟更小的FPGA片上,并通过基于消息融合的访存优化机制、存储单元细粒度划分、预采样随机游走策略等数据流优化手段,提升了FPGA片上访存效率、减少了片外访存数据量,从而提升了随机游走的计算效率。为了提升系统的易用性,本文将系统对外的接口及控制中枢部署到了CPU端,系统的使用仅需输入图数据及随机游走计算任务信息。实验结果表明,相较于随机游走专用计算引擎Knight King,本文所设计的基于FPGA的Random Walk算法加速系统可以达到最高12倍的性能提升。由于系统采用了FPGA作为随机游走的计算平台,因此具有较低的计算功耗。经过评估,FPGA随机游走加速器的功耗仅为2.841 W,远低于通用处理器的计算功耗。并且,本文作为第一个设计随机游走专用硬件加速器的工作,可以为之后的随机游走及其它图计算加速器的架构设计提供一个很好地研究思路。
其他文献
热固性高分子材料由于其永久性的交联点使其具有优异的稳定性和热机械性能,广泛地应用于结构材料、涂料、粘合剂等领域。从本质上来讲,永久性交联点的存在也使得热固性材料回收困难,无法再次利用,造成了资源浪费和环境污染。动态共价聚合物网络(DCPN)的出现,可在减少热固性高分子材料造成环境污染中发挥重要作用。它既保留了热固性材料的优异性能又可以在某些刺激下像热塑性塑料那般可重复加工使用。近年来,动态共价键及
荧光高分子水凝胶是具有可调发光性能的高分子软材料,既具有高分子水凝胶的“软湿”特性和丰富的刺激响应行为,又具有荧光的灵敏度高、应用广泛的特点,在智能显示、仿生软体驱动器和信息防伪加密方面有广阔的应用前景。目前,制备荧光高分子水凝胶常用的方法主要为通过物理或化学的方法向水凝胶基质中引入有机荧光团、镧系配合物、发光纳米粒子等。然而,如何在一个水凝胶体系中引入不同荧光发色团实现全光谱荧光发射,且具备智能
每一个芬斯勒度量可以诱导一个流形上的喷射.在流形上给定一个体积形式,又可以给出射影喷射的概念.我们称射影喷射的Ricci曲率为射影Ricci曲率.在芬斯勒几何中,(α,β)度量是一类特殊的芬斯勒度量.它具有如下形式:F=αφ(s),s=β/α,其中α=(?)是黎曼度量,β=bi(x)yi是1-形式,φ=φ(s)是开区间(-b0,b0)上的正的光滑函数.本文研究的是一类比较特殊的(α,β)度量,φ(
垂直腔面发射激光器(VCSEL)具有阈值电流低、光电转换效率高、耗能少、易与光纤耦合等优点,在光通讯、高密度光存储、激光显示、激光打印、激光照明等领域都具有巨大的应用潜力。近年来,随着氮化物材料外延技术的发展,氮化镓(GaN)基VCSEL受到人们的普遍关注。但器件的制备还普遍存在一些问题:由于该器件结构中布拉格反射器(DBR)不导电,环形的电极导致电流限制不足及载流子传输效果差,降低了GaN VC
大气污染已成为影响城市公共健康的重要问题之一。城市中大气污染物主要来自能源、工业、居住和交通等方面,随着城市化进程加快,能源和交通排放激增,城市大气污染日趋严峻。城市形态是指城市实体的空间构成,展现了城市内部的空间布局与外观特征,已有研究表明污染物的扩散分布会受到城市形态的影响。因此,明确对大气污染物扩散影响显著的城市形态参数,分析各形态参数的影响趋势至关重要。目前,城市形态与空气质量的相关性研究
在21世纪的今天,人们对健康问题越发重视,细菌感染问题已成为人们关注的重点问题。目前细菌感染尤其是手术后引发的感染给病人的身心造成极大的影响,而抗生素的大量使用不可避免会引发耐药菌风险,所以亟需开发新型抗菌剂。众所周知,铜是一种长期应用的广谱杀菌剂,被大量应用在抗菌不锈钢、涂层等领域。但铜往往需要相对较高的浓度才能具备杀菌性能,这可能会导致细胞毒性。本研究前期发现当Cu2+被还原为Cu+时能极大提
显示技术作为重要人机交互界面之一,在快速发展的信息时代中起着举足轻重的作用。现代高分辨率显示屏幕主要采用了有源矩阵平面显示技术(AMFPD),其可以在一帧时间内保持恒定发光,具有低功耗、使用寿命长等特点。AMFPD通常采用薄膜晶体管(TFT)作为像素的开关/驱动元件,而高性能显示技术追求更高的分辨率和更快的刷新频率。因此,对TFT的迁移率提出了更高的要求。非晶氧化铟基TFT具有高场效应迁移率、可低
装配是工业生产中的一个重要环节,工业机器人广泛应用于自动装配领域,而轴孔装配是其中一种典型的装配任务。本文针对轴孔装配任务,为避免卡阻发生,提出了基于视觉和力反馈的主动柔顺装配方法,该方法根据视觉和力信息进行寻孔,根据力反馈完成插孔装配。本文首先对寻孔策略和插孔策略进行了理论分析。设计了视觉定位系统中的图像识别算法,并进行了孔识别的实验,此外还介绍了机械臂的手眼标定原理并进行了标定实验,最终实现了
生物质是一种天然可再生的有机碳资源,将其转化为平台化学品能促进可再生资源的有效利用并提高其附加值。5-羟甲基糠醛(HMF)被认为是一种重要的平台化合物,可通过氧化、还原、醚化、胺化和异构化等转化为多种高附加值化学品。2,5-呋喃二甲醇二烷基醚(BAMF),可作为优秀的生物基燃料与燃油添加剂,将来有望替代传统的石油燃料。BAMF可以通过HMF先加氢还原成2,5-呋喃二甲醇(BHMF)后,再与醇类醚化
随着现代科技的迅猛发展,无人机已被广泛应用于各个领域,包括军事侦察、物资派送、电力巡线、地质勘探和智能安防等。作为无人机应用的关键技术之一,目标跟踪技术已成为机器视觉领域的研究热点。在无人机航拍视频中,跟踪目标往往伴随着背景干扰、尺度变化、遮挡等复杂情况,因此,研究高效、鲁棒的目标跟踪算法对无人机的应用具有十分重要的意义。本论文研究基于深度学习的无人机视频目标跟踪算法,主要的研究工作如下:(1)针