【摘 要】
:
深度神经网络广泛应用于多种领域,例如图像识别、人体姿态估计、视频追踪以及自然语言处理。为了减少大型深度神经网络的训练开销,分布式深度学习是一个常用的做法。分布式深度学习能够克服单台机器存储及算力的限制,让大型深度神经网络训练获得与机器数量线性相关的加速受益成为可能。然而在分布式深度学习中,多台机器进行参数同步时的通信开销成了加速训练的瓶颈,需要利用梯度压缩来缩减需要传输的参数量。其中,梯度稀疏是梯
论文部分内容阅读
深度神经网络广泛应用于多种领域,例如图像识别、人体姿态估计、视频追踪以及自然语言处理。为了减少大型深度神经网络的训练开销,分布式深度学习是一个常用的做法。分布式深度学习能够克服单台机器存储及算力的限制,让大型深度神经网络训练获得与机器数量线性相关的加速受益成为可能。然而在分布式深度学习中,多台机器进行参数同步时的通信开销成了加速训练的瓶颈,需要利用梯度压缩来缩减需要传输的参数量。其中,梯度稀疏是梯度压缩的一种主流方法。现有的梯度稀疏方法是根据选择策略对需要上传的梯度进行筛选,只对重要的梯度进行更新,把不重要的梯度积累在本地等待上传及更新。然而当选取较高的稀疏比例时,相当大一部分梯度被延迟更新,由于自适应优化器的存在,自适应优化器无法分辨当前上传梯度中历史积累梯度和最新梯度的区别,造成模型收敛的偏移,使最终模型精度下降。本文提出一种通用梯度稀疏框架GGS(General Gradient Sparsification Framework),用于克服传统梯度稀疏方法在大比例压缩梯度时收敛速度下降的缺陷。GGS由梯度修正方法及局部梯度批量归一化更新 BN-LG(Batch Normalization Update with Local Gradients)两部分组成。其中梯度修正方法调整了梯度更新步骤的顺序,取消了全局优化器,将优化器设置在本地,让自适应优化器能够正确分辨历史积累梯度与最新梯度,让延迟更新的参数得到正确处理,解决模型收敛偏移的问题。我们提供了数学证明,论证了梯度修正方法在多种自适应优化器下的通用性及收敛性。此外,BN-LG方法采用了混合更新方式,对于批量归一化层的可训练参数,取消了同步上传更新。通过采用BN-LG,GGS可以在不增加通信开销的情况下减轻延迟梯度的影响。我们使用自适应优化器ADAM(Adaptive Moment Estimation)和RMSprop(Root Mean Square Prop),分别在 2,4,8 个节点上,对LeNet-5、CifarNet、DenseNet-121 和 AlexNet 等多种模型进行了实验。实验结果表明,当99.9%的梯度被稀疏化时,模型在测试集上的精度下降不超过1%。为了方便使用,我们将GGS集成进PyTorch,并打包放在开源分布式训练平台OpenPai中。
其他文献
目的 了解重庆市康复专科护士工作开展现状,并分析其影响因素.方法 利用自行设计的调查表对获得重庆市康复专科护士资质的护士进行问卷调查,并运用最优尺度回归分析影响康复专科护士工作开展的因素.结果 共回收问卷120份,回收有效问卷109份,问卷有效回收率为90.83%.康复专科护士工作现状评分为(41.64±12.76)分,临床实践领域评分为(1.89±0.58)分、护理管理领域评分为(1.79±0.66)分、护理教学领域评分为(1.89±0.67)分、护理科研领域评分为(1.39±0.63)分、咨询领域评分
建国以来,我国师范生公费教育制度历经奠基期、发展期、断裂期、探新期、深化期的变迁,这种变迁深受宏观社会环境、利益主体因素、教育自身发展的影响.新时期,我国师范生公费教育制度存在制度文本实践对于培养质量的欠缺、多元利益主体参与培养工作的不足、公费师范教育难显内在价值的困境等挑战.要完善我国师范生公费教育制度,就需强化制度文本实践对于培养质量的关注、改进多元利益主体参与培养工作的不足、突破公费师范教育难显内在价值的困境.
为更好地开展幼儿园课程研究,以2011—2020年CNKI中文数据库的960篇论文和Web of Science英文数据库的1365篇论文为对象,采用CiteSpace研究工具,对国内外幼儿园课程研究整体态势、热点及趋势进行可视化比较.研究发现,国内发文量少于国外,研究与政策紧密相连;国内核心研究机构数量较少,联系松散.国内幼儿园课程的研究热点主题为农村幼儿园课程、课程游戏化、主题课程研究等;而国外较多关注以儿童为中心的课程、语言和读写课程、幼儿身体发展和运动课程研究等.在研究趋势上,国内较关注具有我国文
国务院颁发的《老年教育发展规划(2016—2020年)》鼓励学校结合当地的文化历史、人文资源和民俗民风等特点,推动老年教育地域特色发展.近年来,广州市天河区在打造新岭南文化中心区方面取得了显著的成效,辖内凤凰街(客家山歌)、珠吉街(乞巧文化)成功入选广州市非遗传承基地.广州老年开放大学天河学院借助两个基地的地域民俗文化优势,因地制宜研究开发本土化的老年教育特色课程,并在实践中逐步探索形成了学院、街道、社区等多方协同的工作模式.
本研究采用前后测准实验的方法,探讨课堂议论文写作教学对英语专业学生思辨能力的影响.在某高校英语专业三年级两个自然班的英语议论文写作教学中,分别采用任务型写作教学和常规教学两种教学方式进行了为期一个学期的教学准实验.研究发现,任务型写作教学班的学生在思维相关性、清晰性、深度和广度四个维度发展总体呈显著性.其中,思维相关性发展最快,思维广度的提高幅度最大,而思维清晰度和深度的发展相对缓慢,仍然处于中等偏下的水平.研究提出了任务型写作教学应着重训练学生的思维短板,争取多个维度均衡发展,并将思辨能力培养贯穿于各门
开放大学的科研既要遵循大学科研的共性规范、又要彰显新型大学的特色.进入新时代,开放大学承担了构建终身教育体系、服务全民终身学习的使命以及实现信息技术与教育深度融合的重任,开放大学科研工作随之面临新的发展课题.作为地市级开放大学,无锡开放大学的科研工作面临科研制度不够完善、教师的科研内生动力缺乏、系统内协同研究较少、科研特色逐步凸显但层次偏低及科研成果转化力度不够等问题.解决以上问题,需要提高科研工作的适切性和精准度,从优化科研管理制度供给、激发教师科研的内生动力、构建办学系统科研共同体、培育科研特色与优势
本文结合“出”的本义、语法意义及人的身体经验,构建“出”的意象图式,通过选择不同的注意点,凸显同一意象图式的不同视角、不同方面,来分析“V+出”结构蕴含的丰富语义,进而呈现出该结构语义的扩展路径.
STEM教育在国内虽已取得一定的研究成果,但在教育实践过程中实现深度学习仍有一定的难度,尤其针对于儿童阶段的学生.深度学习具有范导价值、内化价值和生成价值.通过观察分析发现,STEM教育面临着学习目标的偏移、学习过程的游离、学习方式的错位和学习结果的浅层等问题.因此,可以通过明晰学习目标、聚焦学习过程、复归学习方式、深化学习结果等手段有效促进幼儿深度学习.
近年来,由于农业现代化的不断发展以及“十九大”乡村振兴战略的提出,对于农村人才的需求越来越大.“农村干部学历提升工程”项目为太原开放大学实现农村战略性发展、培养农村干部人才提供了一条重要途径.新冠肺炎疫情期间,在农村干部远程教育教学管理实践中发现存在一定的问题,需要在一些方面进行改革性创新,从而使该项目更加顺利地进行,真正提高农村干部的学历水平,响应国家农村发展战略.
随着车联网、智能家居以及智能电网等技术的发展,物联网使人们的生活更加得高效和智能,但物联网设备在身份认证中的安全问题也逐渐暴露出来。传统的物联网设备身份认证机制主要依靠可信的第三方来对设备的身份信息进行管理,但这种方式逐渐不能适应结构复杂且设备数量日益庞大的物联网环境。区块链作为一种分布式的数据账本,具有去中心化、防篡改、可溯源等特性,因此用区块链技术解决物联网设备的身份认证问题十分适合。为解决现