面向CPU-GPU集群的分布式机器学习资源调度框架研究

来源 :西北工业大学学报 | 被引量 : 0次 | 上传用户:Maggie0932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GPU硬件设施的广泛应用,越来越多的分布式机器学习应用程序开始使用CPU-GPU混合集群资源来提高算法的效率。但是,现有的分布式机器学习调度框架要么只考虑CPU资源上的任务调度,要么只考虑GPU资源上的任务调度,即使综合考虑CPU与GPU资源的不同,也很难提高整个系统的资源使用效率,即使用CPU-GPU集群进行分布式机器学习作业面临的关键挑战是如何高效地调度作业中的任务。在对现有的方法进行分析后,提出了一种基于不均匀数据分片的策略,利用线性规划的原理,使得CPU任务时间与GPU任务时间尽可能接近,从而
其他文献
在地面动平衡配平试验中,由于大型回转网状天线主反射器受风阻的影响,卫星天线难以得到正确配平结果。为了解决这一问题,对大型回转网状天线在低压环境与地面标准大气压环境中风阻影响下的动平衡问题进行了研究。以理论分析及圆柱绕流二维试验数据为基础,提出了基于CFD三维流场分析的大型回转网状天线风阻计算方法,将回转状态下网状天线主反射器的分布风阻等效为作用点位于各象限的主矢、主矩,进而通过动力学等效法转化为配平面上的偏心质量,为估算风阻对大型网状天线动平衡精度的影响从而补偿风阻效应提供了一条可行的创新途径。结合某型星
传统水下声呐系统通常采用增大阵列孔径,增加阵元数目来实现角度高分辨,这势必会导致系统复杂、成本高。鉴于大棕蝙蝠利用简单构架的系统获得了令人惊讶的高分辨能力,本文提出了一种仿生目标定位方法。基于多谐波发射、双随机阵接收的仿生体制构建了距离-方位联合字典,进而分析了字典的相干特性并估计了目标的距离和方位角,最后完成了实验验证。结果表明,基于稀疏表达的仿生距离-方位联合估计能够在回波高混叠条件下实现高精度目标定位。
为了解决聚酯非织造布无抗菌性和亲水性差的问题,探讨聚酯非织造布经壳聚糖/氧化石墨烯整理后的抗菌和亲水效果。利用静电吸附作用,通过层层自组装技术对聚酯非织造布进行壳聚糖/氧化石墨烯整理,测试聚酯非织造布K/S值、抗菌性、回潮率以及拉伸性能等。通过考察K/S值,定性地分析壳聚糖、氧化石墨烯在非织造布表面组装状态。发现当壳聚糖质量浓度为3 g/mL时,整理后的聚酯非织造布具有良好的抗菌性和亲水性,断裂强力也略有上升。利用层层自组装技术,将壳聚糖/氧化石墨烯整理到聚酯非织造布,可以使其具有优良的抗菌性和较好的亲水
为改善La掺杂对SnO2粉体气敏灵敏度的影响,利用溶胶-凝胶法制备不同La掺杂含量的SnO2粉体,利用傅里叶红外光谱仪(FT-IR)、透射电镜(TEM)、扫描电镜(SEM)、比表面积及孔径测试仪(BET)以及X射线衍射仪(XRD)等对制得的SnO2和La掺杂SnO2粉体进行表征和分析,并测试制得样品的气敏灵敏度。结果表明:La掺杂减小了SnO2的晶粒粒径。随着La掺杂量的增加,La掺杂SnO
为了契合高效能政府建设以及国家治理能力与治理体系现代化建设的现实需求,为县域政府数字化治理提供有效的评价信息,构建了基于数字化治理的县域政府治理效能评价指标体系,包含6个一级指标、15个二级指标和35个三级指标。采用实地调研法,获取陕西省10个县(区)级政府数字化治理的一手数据,应用信息熵及熵权法展开县域政府治理效能的实证评价与聚类分析。研究结果表明,数字化治理背景下陕西省县域政府治理效能总体评价一般,且在区域水平、维度评价的差异性较大,总体上呈现出“关中较高、陕北次之、陕南最低”的三级阶梯状分布特征。陕
高速列车在隧道内卫星信号缺失,仅依靠由微机电(micro-electromechanical systems,MEMS)器件构成的惯性导航系统(inertial navigation system,INS)误差较大。针对这一问题,在不增加额外传感器的情况下,提出一种利用考虑微惯性测量单元(micro inertial measurement unit,MIMU)在列车上安装角的运动约束来抑制INS误差(consider the installation angles for motion constrai
星载SAR图像智能处理系统需对成像和多种不同任务应用进行在轨实时处理,设计高效专用单芯片多处理器能够有效支持实时性和低功耗的要求,片上数据组织和访存结构是设计重点。分析了SAR成像CSA(chirp scaling)和神经网络VGG-112种典型模型,抽象出遥感图像智能处理过程的协同计算模型。设计了一种带状Tile化数据处理方案及专用多处理架构,提出了一种Tile划分及多Tile同步拼接策略,设计了处理单元之间数据缓存结构,极大降低片外访存带宽,支持多任务模型的并行流水执行。芯片采用28 nm工艺,整体功
针对下沉式开放空间在自然通风方式下的局限性,在西安市冬季阴天、晴天2种天气条件下对商区导入型和中庭广场型下沉式广场的地面入口与广场内的风环境及其风速、温度、湿度等参数进行测量。从城市街区人行高度的行为舒适度、空气质量舒适度、热舒适度等3方面评价下沉式开放广场的风环境。结果表明:在满足行为舒适和热舒适前提下,中庭广场型下沉式广场的风环境舒适度更高;下沉空间内的风速均小于地面入口区域,商区导入型下沉广场的风环境质量更好。
针对浅海移动声源的测距,提出了基于直方图滤波的水下测距算法。该算法以声传播过程中传播损失和目标运动参数以及接收信号作为先验知识,对声源位置函数形成的状态向量进行更新,从而实现浅海声源的测距,并用SwellEx-96实测海试数据库进行了算法的实验验证。结果表明:对移动声源的测距深度误差较小,而探测的水平距离在10 km范围时,水平距离最大测距误差在±10 m,并且可以通过改善目标运动参数等先验知识提高对声源测距的精度,验证了直方图滤波算法可较好地实现对水下移动目标的测距。
为降低武装直升机在破片/弹丸打击下的易损性,主要研究在单次和多次打击下由整机向关键部件的易损性指标分配方法。通过将单次打击同一方向上的系统部件划分为非余度不重叠、非余度重叠以及重叠余度3种情况,提出基于关键部件迎弹面积比例和关键部件易损性评估结果比例的2种指标分配方法;通过将多次打击下的系统部件划分为余度部件和非余度部件,提出基于关键部件易损性结果比例的指标分配方法。在此基础上,结合武装直升机的易损性减缩措施,通过迭代分析实现对应部件的易损性指标要求。对AH-64D直升机进行单次和多次打击下的数值仿真试验