【摘 要】
:
图计算系统作为图算法的载体,它能够将众多图算法封装成简洁高效的系统接口供企业及相关研究人员使用。目前,虽然已经有诸多性能出众的图计算系统应用于科研和工业领域,但这些系统尚未充分发挥平台体系结构优势。本文主要研究了图计算系统中最具代表性的Sp MV算法。通过对图计算系统目前存在的频繁访存、负载不均衡、低效矢量化等问题进行研究分析并采取合理措施优化Sp MV的计算性能,为图计算系统提供全方位的系统级优
论文部分内容阅读
图计算系统作为图算法的载体,它能够将众多图算法封装成简洁高效的系统接口供企业及相关研究人员使用。目前,虽然已经有诸多性能出众的图计算系统应用于科研和工业领域,但这些系统尚未充分发挥平台体系结构优势。本文主要研究了图计算系统中最具代表性的Sp MV算法。通过对图计算系统目前存在的频繁访存、负载不均衡、低效矢量化等问题进行研究分析并采取合理措施优化Sp MV的计算性能,为图计算系统提供全方位的系统级优化。首先,本文设计了一种基于新型存储格式CSR2的图计算系统优化。它是一种新型单一格式,适合在具有SIMD(单指令多数据)矢量化功能的处理器平台上使用。该格式在源代码操作上易于实现且转换开销较低。通过对比目前最先进的单一存储格式CSR5和Intel高性能库MKL执行Sp MV算法的性能效果,我们发现CSR2存储格式具有明显的优势。在Intel Xeon E5-2670 v3平台上,与CSR5相比,CSR2平均加速比为1.401倍(最高可达1.861倍);与MKL相比,CSR2的平均加速比为1.261倍(最高可达5.921倍)。其次,本文设计了一种基于新型负载均衡算法ALBUS的图计算系统优化。它解决了目前图计算系统存在的两大挑战:第一,实现处理器多核均衡负载处理和减少访存操作;第二,充分发挥SIMD矢量化指令集的并行能力。本文选择了20组规则矩阵和20组不规则规矩阵构成基准套件。在Intel Xeon E5-2670 v3 CPU平台上,与CSR5,Merge和MKL相比,对于20组规则矩阵,ALBUS可以分别实现1.59倍、1.32倍、1.48倍(最高可达2.53倍、2.22倍、2.31倍)的平均加速比;对于20组不规则矩阵,ALBUS可以分别实现1.38倍、1.42倍、2.44倍(最高可达2.33倍、2.24倍、5.37倍)的平均加速比。最后,本文设计了一种基于GPU分段式优化策略GSp MV的图计算系统优化。在该算法中,我们通过分段式优化方法达到均衡的负载处理。经实验表明,在Nvidia Tesla T4 GPU平台上,与Merge、Cusparse(CSR)、Cusparse(HYB)相比,GSp MV可以分别实现1.07倍、1.86倍、1.24倍(最高可达1.54倍、138.65倍、2.32倍)的平均加速比。
其他文献
车联网(VANETs)是一个可以为车辆和外界互联网提供通信和信息共享的无线网络,是城市智能交通构建的基石,具有实际应用价值的车联网需要具备的最基本的条件是:消息认证方案和密钥协商方案的安全性与高效率,本论文分析了车联网独特的网络特征以及应用场景,设计了适用于车联网的消息认证以及密钥协商方案,本文主要的研究内容以及贡献概况如下:1)车联网是为车辆提供服务的网络,对消息的认证效率有非常高的要求,本文以
本研究阐述了万寿菊‘雪域3号’的选育过程及其特征特性。以‘雪域3号’及5个万寿菊对照品种为试验材料,参照万寿菊属DUS测试指南,利用23个性状指标,对材料进行差异性、聚类、相关性、主成分的分析,并进行观赏价值评价。基于SSR分子标记构建了‘雪域3号’及其5个对照品种的DNA指纹图谱。为丰富青海地区万寿菊的遗传资源和观赏用新品种提供重要的理论依据。研究结果如下:(1)2012年,青海大学花卉研究中心
目的分析粘连性小肠梗阻患者的NLR、PCT、D-二聚体及乳酸水平,探讨其与肠缺血发生的相关性,为临床手术时机的把握提供一定的依据。方法收集2018年10月至2020年10月青海大学附属医院急诊外科收治的ASBO患者,根据其肠缺血的情况,将其分为未缺血组、缺血组,缺血组根据其术中肠管情况,分为缺血可逆组、缺血不可逆组。针对每位患者,详细收集每位患者的一般病史资料,以及入院第1次和术前血NLR、PCT
针对青稞麸皮口感粗糙,加工利用率低的问题。以青稞原麸皮为对照,研究了超微粉碎、酶法处理、挤压膨化、气流膨化及其酶解与挤压膨化复合技术等对青稞麸皮营养成分、微观结构、粉体特性、功能特性上的改良效果,明确了不同改性青稞麸皮的应用范围,获得改善青稞麸皮粗糙质地和口感的改良技术,并且研发了以改性青稞麸皮为辅料的相关产品。为提高青稞麸皮的加工利用率和附加值提供了理论依据与技术支撑。本研究的主要结论如下:(1
5G移动通信技术的快速发展和智能移动终端的普及,使得用户可以随时随地访问互联网,获取想要的流媒体服务。然而,在信息化建设中,创新、个性化的应用在提高用户使用互联网活跃度的同时也提高了用户对流媒体服务的钻性。因此,为更好地满足用户个性化流媒体服务需求,提高流媒体资源利用率,减轻网络负载压力,本文重点围绕5G网络中的流媒体资源分配关键技术为研究主线,分别从用户需求预测、流媒体资源分配、流媒体服务利润、
研究以青藏高原三江源区不同建植年限黑土滩人工草地内矮嵩草斑块为对象,通过对矮嵩草斑块分布、扩张、繁殖特性、生物量以及人工草地植物群落、根系土壤变化特征等方面分析研究,从矮嵩草种群的角度,探寻人工草地在合理利用状态下向高寒草甸演替的可能性及时间阈值。结果如下:1.随着建植年限的增加,以无性繁殖为主的矮嵩草繁殖速度稳定增长。矮嵩草株丛分蘖、营养枝、生殖枝数量逐渐增加,分蘖、营养枝和生殖枝活体数目占比逐
为解决三江源区“黑土山”草地植被恢复问题,2019年起在达日县开展黑土山阴坡和阳坡牧草品种栽培试验。以青藏高原正在栽培驯化和推广应用的14种禾本科牧草草种为研究对象,观测不同牧草出苗率、生育期以及植株的株高、鲜草产量、种子产量、千粒重等指标,通过对牧草进行适应性评价,筛选出适宜黑土山种植的优良牧草草种,从而为恢复植被和保护生态提供理论基础。结果表明:(1)阳坡和阴坡各参试的14种牧草草种均能够正常
为了解不同肥料对黑土山人工草地土壤及植被的影响,探究植被-土壤系统对无机肥料和微生物菌肥的不同响应,选择在达日县黑土山人工草地上,开展无机肥料(尿素、磷酸二铵、牧草专用肥)和生物菌肥(枯草芽孢杆菌肥、哈茨木霉菌肥、广谱型微生物菌肥)试验。围绕不同肥料对植物群落、土壤理化性质及微生物群落的影响三个方面开展研究,通过分析黑土山人工草地群落结构、生产性能、土壤理化性质、土壤酶活性与微生物特征、以及土壤-
苦水玫瑰中有丰富的营养物质,还富含多糖物质和花色苷物质等次级代谢产物,极具食用价值。本研究于河湟流域西宁、互助、贵德三个地区采集开花期苦水玫瑰各10株,通过因子分析以及逐步回归方程分析,探讨环境因子(土壤理化性质、重金属元素、气候因子)对苦水玫瑰品质特征(水分含量、蛋白质含量、粗脂肪含量、膳食纤维含量、灰分含量、花色苷含量、多糖含量)的影响,并采用多因素线性回归预测模型利用土壤理化性质、重金属元素