【摘 要】
:
GPU因其高并发、高带宽和低功耗的特点,已经广泛应用于高性能计算和深度学习领域。为了充分利用CPU-GPU异构集群的计算能力,最新的开源分布式计算框架Spark增加了支持GPU加速的新特性,但Flink仍不支持GPU任务调度。在集群规模有限的情况下,可以通过扩展计算节点上的GPU数量来提高集群的计算能力。但是GPU的计算能力是动态变化的,并且不同硬件架构或者不同型号的GPU的计算能力是有很大差异的
论文部分内容阅读
GPU因其高并发、高带宽和低功耗的特点,已经广泛应用于高性能计算和深度学习领域。为了充分利用CPU-GPU异构集群的计算能力,最新的开源分布式计算框架Spark增加了支持GPU加速的新特性,但Flink仍不支持GPU任务调度。在集群规模有限的情况下,可以通过扩展计算节点上的GPU数量来提高集群的计算能力。但是GPU的计算能力是动态变化的,并且不同硬件架构或者不同型号的GPU的计算能力是有很大差异的。那么为了实现异构GPU之间的工作负载均衡,每个GPU被分配到的工作负载应该与其计算能力相匹配。但是目前的CPU-GPU异构分布式计算框架都缺乏有效的GPU工作负载均衡调度模型。为了有效地将GPU整合到分布式计算框架,并解决异构环境下的GPU工作负载不均衡问题,本文提出一个多GPU负载均衡调度模型——MLSM。MLSM模型主要用于异构环境下的GPU任务调度和设备资源管理。MLSM的贡献包括:(1)提出了一种细粒度的任务映射机制,可以实现了分布式计算框架的JVM任务和GPU任务之间互相映射。它通过自动任务分解方案将每个JVM任务映射为一系列更细粒度的并且可以并发执行的GPU任务,从而减小了GPU任务粒度,为GPU工作负载均衡调度奠定基础。(2)提出了一个设备资源统一管理机制。该机制可以有效地管理GPU内存和GPU异步流资源,并且降低编程模型的复杂性。设备资源统一管理机制还可以将任务数据缓存在GPU内存中,减少通信开销。(3)提出了一个基于反馈的异步流调整策略。该策略根据前一轮迭代计算结果来更新每个GPU的异步流资源,计算能力高的GPU会创建更多的异步流。空闲的异步流的数量被用来动态衡量GPU的计算能力。(4)提出了一个资源感知的GPU任务调度策略。该策略根据GPU的实时计算能力和资源状态来调度GPU任务的执行,实现异构GPU之间的工作负载均衡。最后,本文基于Spark框架实现了多GPU负载均衡调度模型MLSM,并使用几种代表性的测试用例来评估MLSM的性能。实验结果表明,MLSM可以有效地将GPU整合到分布式计算框架中,并实现异构GPU之间的工作负载均衡。
其他文献
近年来,随着固态毫米波器件的发展,毫米波雷达技术获得了巨大的推动力,其产品不断被应用于各种领域,例如液面监测、汽车防撞、近程测距等。其中,用途最为广泛的是线性调频连续波(LFMCW)体制雷达,它在超高频段覆盖了超大的带宽,既保证了精度又保证了距离分辨率,可以实现高精度的测距功能。对现阶段的研究进行分析可知,三维形变监测系统是亟需开发的一套系统,传统的监测手段由于环境复杂、自动化不足等缺陷不再满足现
基于我国文化背景的特殊性,祖辈与母亲共同养育智力障碍儿童是一种普遍且长期存在的特有现象,共同养育关系如何对母亲的教养压力和儿童行为发展有着十分重要的影响。而智力障碍儿童伴随着出生便存在一定的情绪问题行为,如果在之后的发展中该问题行为持续出现不但会加重母亲的压力,而且会影响儿童的身心健康,甚至会造成其成年后的社会适应能力不足。因而,本研究在查阅并分析相关文献的基础上,采用共同养育关系量表、母亲教养压
自“乡村振兴战略”提出后,乡村地区的建设发展问题又一次被推向高潮。村庄规划作为指导乡村地区发展的基础性规划之一,也越来越受到国家和社会的重视。我国的村庄规划起始于改革开放后,在为期40多年的发展过程中,一定程度上解决了农房无序扩张的问题;向农村地区投放了大量的基础设施与公共服务设施;改善了乡村地区的生态环境;推动了乡村地区的全面进步。但是,随着时代的变迁,乡村社会开始显现出其他问题:乡村治理问题愈
随着研究者们对钙钛矿光电特性研究的不断深入,钙钛矿已经成为光伏器件,光电检测器件等领域内最具有潜力的新型半导体材料之一。钙钛矿单晶的研究基础,其中包括多种晶体合成方法,丰富的晶体表征手段以及性能优越的单晶器件等等。常用的液相旋涂方法制备钙钛矿多晶薄膜,在稳定性,基础光电性能上均有一定的不足。与此相反,钙钛矿单晶拥有高的光电转化效率和更出色的稳定性。同时,现在对钙钛矿晶体生长条件或制备方法的调节,通
人工智能物联网的发展,使得便携式互连电子设备需求骤增,同时对设备的微型化、集成化提出了更高的要求,从而激发微储能的巨大需求。片上(on chip)储能作为微储能形式之一,因其单位面积上的空间利用率高,更易于满足集成微系统中的空间要求。但是如何获得高能量密度和功率密度,且循环性能优良的on chip储能器件是个亟待解决的问题。目前的微器件多以薄膜电极和叉指电极作为储能器件的电极,其存在一个普遍的问题
当下,互联网应用开发非常重视流量,用户越多产生的价值越大。而feed流作为一种典型的流量入口,被越来越多的互联网产商使用,也受到互联网用户的广泛喜爱。但在数据以及用户数量急剧攀升至海量之后,feed流系统将面临高并发、吞吐量、实时性等诸多方面的严峻考验。因此非常有必要引入一套能够支撑海量数据和用户并同时能保证实时性的feed流系统。本文在调研了众多互联网头部产商的产品架构以及当前主流技术工具之后,
“十三五”期间,我国的新能源发电技术得到了快速发展,风电及其相关产业的规模也在不断扩大并保持着持续增长的态势。其中,IGBT模块和直流母线电容器作为风电变流器的核心部件,一旦二者或是其中某一部件失效,都将影响风电系统的可靠运行。发展以IGBT模块和直流母线电容器为主的风电变流器核心部件的状态监测技术,对变流器检修计划的优化以及风电系统可靠性的提升具有十分重要的指导意义。针对现阶段风电变流器核心部件
近年来电力电子技术在工业设备、通信系统、交通运输、航空航天等各个方面得到了广泛的应用并且正在迅速发展,使得飞跨电容多电平变换器在各个领域应用。根据调查显示,开关器件是系统中最容易出现故障的元件,而飞跨电容多电平变换器中的开关器件数量较多,因此开展可靠性研究的工作具有重大意义。具有容错运行能力的飞跨电容多电平变换器是提高系统可靠性的优良解决方案之一。本文提出了一种具有容错运行能力的飞跨电容多电平DC
交通预测作为智能交通系统中一个非常重要的研究领域,对于出行规划、交通管理和拥塞控制等方面有着非凡的意义。近年来,各种图卷积网络模型层出不穷,极大地促进了交通预测领域的发展。然而,现有的采用图卷积网络的交通预测模型仍然存在对空间依赖关系挖掘不全面、时间特征挖掘不充分以及模型缺乏自适应性等主要问题。针对交通预测模型中存在的问题,结合其研究现状,本文设计出了效果更佳的模型和方法来进一步提高交通预测的性能
随着科学技术的不断发展,许多研究学者对近场声悬浮的机理进行了研究,基于该原理的应用也随之诞生,譬如近场声悬浮轴承、近场声悬浮传输导轨等。近场声悬浮轴承相比于传统的接触式轴承而言具有非接触,空气润滑,寿命长,可控制等优点,但该轴承-转子系统为复杂的非线性系统,轴心轨迹求解耗时长,构建一种新型的求解模型十分重要,同时可进一步进行轴心轨迹的研究,改善轴承的工作效率。在近场声悬浮传输导轨中,可实现对物体进