【摘 要】
:
深度学习技术自21世纪以来吸引了工业界和学术界的广泛关注,并被成功应用于不同的任务场景中。深度学习技术的核心是深度神经网络模型,而深度神经网络在应用前需要进行模型训练。随着深度学习的快速发展,模型的复杂化和训练数据集的扩大化使得单机训练模式无法满足模型训练的需求,因为过长的训练周期不利于模型的快速开发部署。于是分布式深度学习训练应运而生,通过投入更多的计算节点资源开展并行化训练,有效缩短了模型的训
论文部分内容阅读
深度学习技术自21世纪以来吸引了工业界和学术界的广泛关注,并被成功应用于不同的任务场景中。深度学习技术的核心是深度神经网络模型,而深度神经网络在应用前需要进行模型训练。随着深度学习的快速发展,模型的复杂化和训练数据集的扩大化使得单机训练模式无法满足模型训练的需求,因为过长的训练周期不利于模型的快速开发部署。于是分布式深度学习训练应运而生,通过投入更多的计算节点资源开展并行化训练,有效缩短了模型的训练时间。然而,分布式训练在降低训练时间的同时,节点间频繁的消息通信也产生了额外的通信开销,限制了分布式训练所带来的性能优化效果。为了进一步提高计算资源利用率,缩短神经网络模型的训练时间,对通信开销开展有针对性的优化工作显的尤为重要。本文研究分布式深度学习的通信开销优化方法。具体地说,研究用于分布式训练过程中通信负载的截取工具,以全面地理解分布式通信过程;研究通信开销的重叠优化技术,以提高计算资源的利用率,降低通信开销所造成的性能损失;研究通信操作稀疏化技术,以降低通信开销和对更多的通信开销进行掩盖,以进一步提升分布式深度学习训练性能。本文的主要工作和创新包括以下三个方面:1.为了深入了解分布式训练的通信过程,提出了用于通信负载截取的工具Sketch DLC。Sketch DLC会记录节点中执行的每个通信操作,并为每一个节点生成独立的通信负载文件,基于得到的负载文件可以实现以下三个目的。第一,深入了解分布式训练过程中的通信模式,包括通信操作的执行顺序、通信量、通信操作之间的依赖关系等。第二,用于网络模拟仿真实验的通信负载注入,因为负载文件是基于真实的深度学习应用获取的,可以有效提高仿真实验的精度。第三,对分布式训练过程中各种类型的开销进行量化评估,从而分析不同开销之间的大小关系,以及集群规模、网络带宽、批大小等变量对不同开销的影响趋势。2.针对分布式训练过程中同异步更新算法各自的不足,提出了单步延迟更新算法OD-SGD。该算法利用计算开销对通信开销进行掩盖,通过快速开始下一次迭代训练提高计算资源利用率,优化分布式训练性能。OD-SGD结合了同异步更新算法各自的优势特征,在分布式训练过程中,同时在参数服务器端和计算节点端维护全局更新函数和本地更新函数,前者以同步的方式进行全局权重更新,而后者以异步的方式进行本地权重更新。实验结果证明,OD-SGD算法可以取得与同步更新算法接近甚至更高的模型收敛精度,但拥有更快的训练速度,甚至超过异步更新算法的训练速度。3.针对分布式训练过程中,当通信开销显著大于计算开销时,单步延迟更新算法有限的性能优化效果,提出了多步延迟更新算法SSD-SGD。该算法改进了OD-SGD以实现进一步的性能提升。相比于OD-SGD,SSD-SGD对通信操作进行了稀疏化处理,设计了新的本地更新算法。通信操作稀疏化处理后,计算节点只会周期性执行权重的取回操作,在减少纯消息通信时间的同时也大幅减少了同步开销,并且可以利用更多次迭代的计算开销对通信开销进行掩盖。新的本地更新算法利用全局梯度信息进行更新操作,并减少了对计算资源的占用。实验结果证明,在一定的延迟步数内,SSD-SGD算法在取得比同步更新算法更高模型收敛精度的同时,也获得了明显快于异步更新算法的训练速度,最高提升了110%。
其他文献
品牌是实体有价值的一种资产,加强品牌价值研究有助于实施我国的品牌战略,提升我国品牌的影响力。Interbrand模型是经典的品牌价值评估模型,受到理论和实务界的广泛认可,但原有的Interbrand品牌价值评估模型并不完全适用膳食营养补充剂企业的品牌价值评估,如在估算品牌强度时没有考虑消费者视角,为此需要进行一定的改进。本文在充分研读已有文献的基础上,选择较少前人研究的膳食补充剂行业为研究对象,通
海洋环境噪声中携带着丰富的水体和海底环境信息,采用被动噪声干涉测量技术从海洋环境噪声中提取有用信息,并用来反演地声环境参数,成为近年来研究的一个热点课题。这种方法要求噪声场必须是由空间上均匀分布的、互不相干的随机噪声源产生的良好均分的扩散场。然而,现实世界中,海洋环境噪声经常存在着很多强干扰信号,破坏了海洋环境噪声场的均分性,从而增大了利用海洋环境噪声的难度。近年来,研究者们提出了许多时域、频域的
代理问题伴随着现代企业制度而生,自提出以来就受到了广泛的关注。早期的理论认为,代理问题产生于管理层和股东之间的利益冲突。管理层出于自身利益最大化的目标做出决策,并不一定与股东的目标保持一致。随着理论的发展,学者们意识到不仅是股东与管理层之间存在代理冲突,大股东与小股东之间、内部人(股东和管理层)和外部人(债权人)之间也存在冲突。股东和管理层与债权人之间的利益冲突带来所有成本就是债权代理成本。债权代
目的 分析2例Servo-i型呼吸机维修案例供同行参考。方法 分析呼吸机故障报错原因,结合相关元器件在临床中实际的使用环境,逐一排查元器件,确定故障部件,对故障部件进行更换。结果 两起故障在维修后均自检通过,呼吸机各项数值在正常范围内。结论 设备维修时,除了掌握设备结构和工作原理,还需要灵活运用相关的电路知识,并注意临床的使用细节。
在跨国公司逐渐成为资本全球化重要推动者的背景下,如何对跨国公司内部融资进行有效管理,成为各税收管辖区日渐关注的问题。跨境资金池作为集团内部资金集中管理的一种重要工具,主要依靠资金归集账户来实现资金集中管理并借此产生协同效应,在为集团附属公司提供短期资金流动性方面具备良好成效;与此同时,跨境资金池在节约利息成本、提升资金使用效率、提升资金透明度和降低内控风险方面均有优势。随着我国企业国际业务的拓广,
全球超重和肥胖人数的不断上升使肥胖症成为全球公共卫生中最突出的问题之一。WHO调查数据显示,自1975年以来,全世界的肥胖人口增长了近两倍。中国也面临同样的健康难题,随着我国经济迅速发展,居民生活水平逐步提升,人们的工作与生活方式逐步转向久坐工作和高脂肪、多糖多盐等不健康行为习惯。根据我国2020年调查报告,我国已有6亿人超重或肥胖,高居全球第一。除去超重、肥胖的高基数,其增长率也不容乐观,在19
习近平总书记强调,当代青年要继承弘扬革命先烈的优良传统,砥砺前进,这是宝贵的精神财富,万万不能遗忘。中国共产党的抗战家书真实而又生动地记载了抗日战争时期中国共产党领导的数以万计的民族英雄、社会各阶层、各行业爱国人士和海外侨胞积极参与抗战的全过程。抗战家书作为优秀红色资源,一方面,生动形象地展示了漫长的反抗帝国主义战争中我国军民的心路历程和真实历史情况;另一方面,抗战家书能够使人们从中更加身临其境地
A股市场与国际上较为成熟的股票市场相比,参与主体、发展时间、运行机制、监管结构等方面都存在显著差异,市场上仍然存在众多投机者在寻找投资机会,期望获得超额收益。幻方、九坤等具有专业能力的机构投资者通过找到有效的定价因子构建合适的投资策略,从而获得了高额的回报。由此,如何找到有效的定价因子备受学术界和实业界的关注。近年来,众多学者从微观因素和宏观因素两方面探究股票收益的影响因素,宏观因素主要包括经济增
银行资本是商业银行开展业务的基础,对其开展业务、提高抵御风险的能力有着不可替代的重要性。鉴于现代商业银行在市场经济中的独特地位,各国政府不断加强了对现代商业银行的监督力度,引导银行更好的服务实体经济,这使得银行面临着日益趋严的监管压力和资本补充压力。但另一方面,近些年来在中国宏观经济增速减缓,叠加新冠疫情冲击的大背景,商业银行不良贷款率指标持续恶化,资产利润率持续下降,通过内源性融资来缓解资本压力
随着市场对锂离子电池(LIBs)需求的不断增加,人们开始对锂资源的储量和成本产生了担忧。金属钠(Na)和金属钾(K)储量丰富且成本低廉,因此钠离子电池(SIBs)和钾离子电池(PIBs)逐渐进入人们的视野。但传统的石墨负极在LIBs,SIBs和PIBs中的理论容量分别仅为372 m Ah/g,31 m Ah/g和279 m Ah/g。因此,寻找合适的宿主材料以同时满足LIBs,SIBs和PIBs高