分布式深度学习中参数交换优化机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:easy69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习算法正得到越来越广泛的关注和应用,然而随着输入训练数据集和神经网络模型的增大,单节点进行深度学习训练存在内存限制以及训练耗时等问题,分布式深度学习应运而生。其中,参数服务器多基于分布式方法设计,普遍采用并行随机梯度下降算法进行梯度更新训练。分布式参数服务器的设计能有效提升深度学习的训练速度,但面对大规模神经网络参数时,工作节点和参数服务器节点进行参数交换的时间过长,会消耗较多并行训练的时间,是整个分布式训练中的瓶颈。现有的解决方式是依靠手动优化参数交换的时间间隔,以降低参数交换频率和开销。手动设置的各工作节点交换时间间隔固定且相等,来自不同工作节点的参数交换请求会在近乎相同的时间点到达参数服务器节点而呈现请求突发现象;而参数服务器节点资源有限,不同的参数交换请求必须通过排队依次获得其资源以得到处理,瓶颈依然存在。针对上述问题,设计了一种通过自动设置最佳参数交换时间间隔来消除分布式深度学习参数交换瓶颈同时保证训练准确率的方法和系统;并在内存容量足够容纳整个参数模型的前提下,对并行随机梯度下降算法进行了优化。其工作机制为:通过监控参数服务器节点的资源使用情况,动态为各个工作节点选取一定范围内不同的参数交换时间间隔以避免请求突发现象,并在达到时间间隔上限时进行强制参数交换,依此来消除参数交换瓶颈的同时保证准确率。实验表明,分布式深度学习中参数交换优化机制能够在保证深度学习训练准确率的前提下,使参数交换速率提升8倍,有效克服了并行训练中参数交换瓶颈以及参数交换请求突发问题,从而提升了训练速度。
其他文献
新型干法水泥窑在水泥工业中得到了越来越广泛的应用,在干法窑的生产中,如何实现从配料、烧成、到监控报警全程实现电脑监控是一个难题。人工进行这些操作,首先长期增加了人力成
XML(eXtensible Markup Language,可扩展标记语言)自发布之日起就以其良好的可扩展性受到业界的普遍欢迎和支持,越来越多的应用领域已经将其作为主要的存储格式和传输媒体。随
Rootkit是攻击者在入侵系统后用来保持对系统的超级用户访问权限,创建后门和隐藏攻击痕迹等常采用的一种技术。Rootkit存在于Linux、Solaris和Windows等各种操作系统上。根据
目前,随着手机用户数的不断增加及移动通信技术的发展,越来越多的手机用户开始尝试使用移动增值服务。移动增值服务以其移动性、即时性、个人性的优势逐渐进入人们的日常生活。
随着信息技术和网络技术不断发展,Web服务已经迅速成长为网络信息集成领域的关键技术之一。微软公司更是通过“一切都是服务”来概括Web服务将给当前IT业带来的冲击。于是,在现
虚拟机动态迁移是虚拟化技术的关键技术之一,在保持虚拟机运行提供对外服务的同时,能将其完整、无缝地从一台物理主机迁移到其他物理主机上运行。而内存迁移因应用程序不间断
本文首先讨论了信息家电的特点,提出了信息家电体系结构框架的构想,并就信息家电接口描述语言在整个体系结构中所起的关键作用做了介绍;将面向对象的思想引入信息家电体系结构的
随着信息化进程的推进,在信息检索、模糊物体匹配、数据集成、传感器网络、社交网络等应用领域存在着大量的不确定数据。然而传统的关系数据库只能处理确定的数据,对于概率数
学位
本体作为一种能在语义和知识层次上描述概念的建模工具,可有效地解决知识工程中知识共享和重用两大重点问题。近几年本体已经成为人工智能领域的研究热点,主要研究本体表示、本