加速AI分布式训练研究和实践

来源 :电信技术 | 被引量 : 0次 | 上传用户:george_ding
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着运营商智慧AI应用所处理的数据和深度学习模型的规模变得日益庞大,需要反复的迭代和优化过程,人工智能的分布式训练变得越来越重要。文中对分布式训练的关键要素和方法进行研究,如模型并行、数据并行(同步更新、异步更新)、通信网络设计等方面。最后对山东移动在AI架构设计和提高AI模型的分布式训练效率的实践和经验进行总结。
其他文献
湖北省孝感学院拟在校园北区中部兴建北区图书馆,基础采用人工挖孔桩.经现场原位载荷试验,拟定的桩端持力层承载力无法满足设计要求.后采用后压浆技术对该部分桩端持力层进行
从分析现有石煤矿山生产的安全现状入手,指出制约陕西安康市石煤矿正常生产,可持续发展中的主要矛盾及解决的思路,为当地政府及其主管部门制订规划,为行业发展提供咨询建议。
安全监督机制是为了适应企业不断发展和生存的需要而建立的。安全监督人员监督现场工作的依据是标准。降低标准是事故的隐患。现场HSE的表现,是衡量现场安全管理的直接体现。
目的分析3D打印技术辅助椎弓根螺钉置入治疗胸腰椎骨折的临床效果。方法将2017年7月—2019年7月收治的40例胸腰椎骨折患者作为研究对象,其中20例患者行常规椎弓根螺钉置入治
概述了新疆塔城哈拉布拉水库混凝土面板堆石坝在面板混凝土的施工中,通过对面板混凝土配合比的优化,改进混凝土面板的施工工艺,加强混凝土面板的施工质量控制与混凝土养护工艺等
通过对溢洪道闸门各规格尺寸的测量,分析了影响测量精度的各种因素。通过误差理论计算,得出了利用常规仪器测量,同样可以满足一般安装工程高精度要求的结论。为设备安装工程测量提出了有效的方法和依据。