基于异构内存的图处理关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:GYQ865739853
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图处理作为一种典型的大数据应用,广泛应用于科学计算、社交网络和推荐系统等领域。为了高效地处理图数据,往往需要采用内存计算技术来避免耗时的读写操作。然而,由于传统的动态随机访问存储器(Dynamic Random Access Memory,DRAM)面临严重的容量可扩展性问题,极大地制约了数据规模不断增大的图处理应用的性能。新兴的非易失性内存(Non-volatile Memory,NVM)支持字节寻址,同时具有比DRAM更高的密度、更低的能耗和成本,有可能从根本上改变内存系统的结构。基于将两者的优势进行结合的异构内存系统构建图处理平台,成为一种新的大规模图数据处理方案。传统的图处理平台在异构内存系统上不能获得最优的性能,因为其忽略了内存的异构性。单机内存图处理平台如何更好地利用异构内存主要存在三个方面的挑战:首先是异构内存环境下图数据如何合理地放置和管理才能最小化高延迟NVM对图算法性能的影响;其次是在图算法执行过程中如何解决因为内存异构带来的负载不均衡问题;最后是异构内存系统通常采用NUMA(Non Uniform Memory Access)架构实现,图处理平台如何应对更加复杂的NUMA节点间访存不对称问题。为了解决以上问题,从静态数据管理、动态负载均衡和NUMA节点间通信三个角度进行了深入研究,主要工作如下:首先,提出了异构内存环境下图结构感知的数据管理机制。NVM相比于DRAM具有较高的延迟和较低的带宽,为了高效地利用大容量的异构内存,最关键的挑战是如何将数据合理地放置在DRAM和NVM上。基于NVM写延迟高于读延迟、顺序访问带宽高于随机访问带宽的特性,提出了图结构感知的数据放置策略。进一步实验发现在异构内存中处理大规模图数据时,大量的快表(Translate Lookaside Buffer,TLB)缺失造成了新的性能瓶颈。提出了大页技术和禁用NUMA自动迁移以减轻虚拟-物理地址转换和页面管理的开销。另外,通过图划分和任务分解减少处理器的空闲等待,通过数据结构感知的预取技术提高缓存命中率,进一步隐藏了高延迟NVM对图算法性能的影响。实验结果表明,相比于传统的图处理平台,采用图结构感知的数据管理机制可提高48%的算法性能。其次,提出了异构内存环境下依赖感知的图处理负载均衡机制。在异构内存系统中运行图算法会带来内存的负载不均衡,传统图处理平台使用的负载均衡技术在异构内存系统中不够有效。数据迁移与工作窃取机制相结合,可以进一步提高图处理的效率,但是不同子图中数据的交错访问严重影响数据迁移的有效性。因此,提出了通过降低子图间数据依赖进行数据迁移的负载均衡策略NVMGraph。首先,在图划分时将每个工作线程需要随机访问的数据合并到单个子图中,以减轻子图间的数据依赖。其次,在运行时通过算法指导的工作负载分析,从本轮迭代的结果中准确预测之后迭代中各个子图的工作负载,然后通过性能模型指导的数据迁移在两种内存中高效地迁移数据。实验结果表明,和现有的图处理平台相比,NVMGraph可以提高图算法40%的性能。最后,提出了异构内存环境下NUMA感知的图处理通信优化机制。DRAM和NVM之间的访存延迟差异,使得NUMA节点间的通信变得更加复杂。现有的图处理平台没有考虑NUMA节点间的内存异构性,不能获得最优的性能。因此,设计了异构内存环境下NUMA感知的图处理平台HNGraph,从减少高延迟远程NVM访问的数量和降低高延迟远程NVM访问的开销两方面优化了NUMA节点间的通信。首先,HNGraph利用度数感知的图划分策略使大部分随机访问的数据位于DRAM节点以减少高延迟NVM访问的数量。其次,对于仍然存在的远程NVM随机访问,HNGraph采用了混合的NUMA节点间通信机制来降低远程数据访问的开销。与传统的图处理平台相比,HNGraph在采用NUMA架构的异构内存系统中可以提高62%的算法性能。
其他文献
随着信息技术的快速发展,光电探测器的功能集成化发展趋势已不可避免。二维材料由于超薄的结构、丰富的物理性质和强的光物质相互作用等特性为光电探测器的发展带来了新的机遇。在众多二维材料中,新兴的二维PdSe2半导体兼具宽的可调带隙(0~1.3 e V)、高的载流子迁移率(>1000 cm~2 V-1 s-1)、强的各向异性和可调的双极性等优点,不仅为光电性能的调控提供了新的维度,也为光电器件的功能集成创
学位
规范理论通过局域规范对称性来构造物质之间的相互作用,并且规范理论的自洽性要求物理观测量不依赖于规范条件。该理论的预言在经典物理和基本粒子散射过程上得到了充分的检验。然而,当研究有量子束缚态参与的过程时,理论的预言规范依赖。理论预言的规范依赖和实验结果确定相冲突,以至于有一段时间,人们倾向于认为存在一种“优选规范条件”。同时,还有一批学者通过构造所谓的“规范无关”的哈密顿算符来解决这一冲突。然而,“
学位
<正>麦浪滚滚,收割机轰鸣,山东夏粮再获丰收,各粮食收购点陆续开秤收购,空气中满是收获的味道。在新冠肺炎疫情影响下,今年的夏收显得格外重要。作为因粮而生、伴粮成长的农业政策性银行,农发行山东省分行采取"购销形势早调研、信贷政策早沟通、信贷资金早预测、业务办理早着手"的工作举措,提前备足300亿元专项信贷资金为夏收护航。
期刊
随着时间的推移,工业基地周围的污染会加剧,空分设备周围大气中的杂质含量会升高;因此分子筛的性能与大气中杂质含量的关系研究,对空分设备的设计使用和对空分设备的运行管理有着重要的意义。该文介绍了酒钢制氧21000m~3/h空分分子筛吸附器分子筛优化后效果。
期刊
GPS测绘技术应用在矿山地质测绘中需要注意很多方面的问题,如选择测量基准站、确定转换参数、科学选择测量时间。同时,工作人员还应该明确矿山地质测绘工作的开展中使用GPS测绘技术对地质测量工序的优化起到促进作用,且地质测绘结果的精度也相应地提高,有效地预测地质灾害。在实际的应用过程中可从精密工程测绘、野外地质测绘、工程控制测量、信息化测试图像、动态测绘等方面探讨GPS测绘技术在矿山地质测绘工作中的应用
期刊
与电荷有序以及自旋有序相关联的超导材料不仅是物理学上的研究热点,也与未来生产生活的变革以及现代科技的发展息息相关,展现出了巨大的应用前景。低维钼紫青铜由于材料内部电子本身的低维特性和易于操控的特点,以及在低温下表现出电荷密度波和超导相变的丰富物性,一直备受科学家们的密切关注。与此同时,近些年来不断发展起来的脉冲强磁场技术为研究这类强关联电子体系提供了很好的实验平台和机遇。强磁场与极低温相结合,可以
学位
目的建立可同时测定人血浆中厄贝沙坦(irbesartan,IBST)和氢氯噻嗪(hydrochlorothiazide,HCZ)浓度的LC-MS/MS测定方法,并用于厄贝沙坦氢氯噻嗪(IBST/HCZ)片人体生物等效性研究。方法血浆样品经过蛋白沉淀法处理后上样,采用IBST-d4和甲氯噻嗪(chlorothiazide,MCTZ)作为内标。色谱柱为Waters ACQUITY UPLC?XTERR
期刊
量子信息技术有望突破传统信息技术在信息容量、处理速度和安全等方面的瓶颈,因而受到当前世界各国学界和工业界的广泛关注。四十多年来,科学家们提出并发展了多种不同的量子信息处理技术物理实现平台,其中集成光量子平台是一种具有非凡潜力的平台。一方面,其具有大规模光量子信息处理所需的可集成性、功能可拓展性以及稳定性,另外一方面光量子信息处理还具有抗退相干、潜在高速率、大带宽等优势。为了在集成光子芯片上实现大规
学位
【目的】针对旋转弹测向系统在飞行过程中由于强杂波环境带来的误差干扰问题进行了研究,提出一种实时校正的波达方向(DOA)估计算法。【方法】该算法利用了阵列旋转角度这一先验条件,基于最大似然(ML)准则实现了对共形阵列误差和信号空域-极化域参数的联合估计结果。【结果】仿真实验表明,该算法对存在方位依赖的幅相不一致性误差的阵列系统可以实现在线的误差和信号参数联合估计,且该算法的估计性能与阵列平台旋转次数
期刊
文章对基层卫生人员必须掌握的甲状腺结节相关知识进行介绍。
期刊