面向深度学习的随机梯度优化算法研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:yufengdetianxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习已经成为人工智能领域内的一种重要技术,并且成功应用于计算机视觉、自动驾驶、物联网、智能机器人等关键领域。在深度学习中,深度模型的训练过程是一个重要任务,该过程可以看成一个优化问题。所以,很多优化算法被应用于模型训练任务中。其中,随机梯度优化算法是一种广泛应用于深度模型训练的算法。但是随机梯度优化算法的收敛速度缓慢,为了克服这一问题,很多学习率自适应的优化算法被提出,这些自适应优化算法显著的加快了收敛速度。然而,当前日益复杂的应用环境给深度学习带来了高维、海量的数据,这使得深度模型的训练任务更加困难。因此,应用于深度模型训练的优化算法应该具有易于实现、收敛速度快、计算成本低等特点。目前,易于实现且收敛速度快的优化算法大部分是基于随机梯度的自适应优化算法。然而,这些优化算法在处理深度学习的训练任务时,存在两个导致计算成本过高的因素:1.这些优化算法每次迭代时都会计算决策变量的全坐标梯度,因此在模型训练过程中产生了高昂的计算成本;2.深度模型的训练往往是一个受限优化问题,而随机梯度自适应优化算法在处理它们时都会计算高阶的投影距离(投影算子),所以投影算子给训练过程带来了巨大的计算成本。为了解决以上两个问题,从而减少深度模型训练的计算成本,本文将完成以下研究内容:(1)针对一种流行的自适应随机梯度算法(称为Adam算法)的全坐标梯度计算问题,提出了一种随机坐标块Adam算法,该算法利用随机坐标块方法减少了大量的计算成本。通过理论分析证明了该算法是收敛的,且具有O(?)的后悔界(其中为迭代次数,下同),并利用在公开数据集上进行的仿真实验验证了理论分析的结果。(2)针对一种具有动态学习率的自适应随机梯度算法(称为Ada Bound算法)的全坐标梯度计算问题,提出了一种随机坐标块Ada Bound算法,该算法利用随机坐标块方法减少了每次迭代的计算成本。通过理论证明分析了该算法的收敛性,且得到其后悔界为O(?),并通过仿真实验验证了收敛性证明的结果。(3)针对随机梯度优化算法在深度模型训练过程中产生的投影算子问题,提出了一种无投影Adam算法,该算法利用Frank-Wolfe方法将高阶的投影距离计算替换成一维线性搜索,从而避免了成本高昂的投影算子。通过理论证明分析了该算法的收敛性,且得出其后悔界为O(T3/4),并利用公开数据集上的仿真实验验证了证明结果。(4)针对随机梯度优化算法的全坐标计算和投影算子问题,提出了一种无投影随机坐标块算法,该算法成功应用于分布式深度学习中的子模最大化问题,利用随机坐标块方法和Frank-Wolfe方法避免了决策变量的全梯度计算和投影算子,从而很大程度的减少了计算成本。通过理论分析证明了该算法的收敛性,并得出其能在有限的O(1/(?))次迭代内得到紧近似值(?),且利用公开数据集上进行的仿真实验验证了证明结果。本文主要研究深度学习中随机梯度优化理论。针对深度模型训练过程中的高昂计算成本问题,利用随机坐标块方法和Frank-Wolfe方法避免了大量的计算成本,提出了四种不同的随机梯度自适应优化算法,且均在理论上进行了证明,并在主流的公开数据集上取得了良好性能。
其他文献
我国高速公路的迅速发展,形成了以沥青路面为主的公路网,而坑槽作为沥青路面病害之一,不仅直接影响了行车安全,还降低了道路的使用寿命、浪费社会资源。目前沥青路面坑槽修补采用热补、冷补以及热再生修补等方式,但修补后的坑槽区域仍旧容易再次损伤,而重复的对坑槽区域进行维修不但增加了经济成本,而且长时间的交通关闭,直接影响了社会秩序的正常进行,所以对坑槽修补结构进行力学特性分析,为改进坑槽修补技术、提高坑槽修
当前,全球化经济持续发展,各国经济实力持续增强,各大行业的竞争也日渐加剧,对生产型企业的长远发展造成了很大的影响。在经济蓬勃发展,金融市场持续进步的时代背景下,生产型
在难美项群的比赛中,对于一个优秀的成套来说,难度是核心,完成是保障,艺术是提升。国际体联在2013-2016周期,对全部奥运项目和非奥项目均提出了“总分并列取完成分优先”的破并法则,好的艺术表现和高难动作展示均要求以完美完成为前提条件。在2017-2020周期,对由于训练水平不足和比赛心理素质不过硬,导致出现较大失误的成套,追加了完成减1.0分的判罚。高难度动作不再是体操类项目制胜的唯一因素,有完
图作为一种复杂的数据结构通常用来对现实世界中的问题进行建模,随着大数据时代的到来,现实世界图的规模迅速增长并超过普通单台计算机的内存容量。为了能够在有限的内存中对
大规模图计算是大数据处理领域中的一个重要分支。核外环境下的大规模图计算系统为用户提供了一个方便的图计算环境,然而现有的图计算系统提供的编程接口受限于底层的处理模
吡唑类化合物具有N—N、C—N、C=N键结构,具有较高的生成焓,在吡唑杂环中可进行亲电取代反应。由于吡唑具有对人体低毒、高效、安全等优良的化学活性,因此近年来,硝基吡唑类
二胡曲《二泉映月》是一首在世界范围内广为流传的音乐作品,在国际上享有较高的知名度。而钢琴曲《二泉映月》正是储望华先生通过对二胡曲《二泉映月》进行改编创作得来的作品。本文对储望华先生的钢琴作品《二泉映月》进行了分析。文章主要由五部分构成,第一部分主要阐述了本文的选题缘由、研究现状以及研究方法;第二部分主要介绍了作曲者储望华先生及此曲的创作背景;第三部分从作品本体出发,探索作品本身的曲式、旋律、节奏、
产品的外包装是产品与消费者产生的最直接的联系,在消费速度加快,消费水平不断提升的当今社会,产品的包装在购买的过程中承担的角色越来越重要。产品的包装不仅仅是商品理念的体现,更是消费者生活理念的体现。具有创意感、时尚感的商品包装更容易被消费者接受。随着社会观念的转变,大部分消费者都追求更高的生活品质。花茶的特质特别符合现在人们对于健康生活的追求,饮用花茶的人群渐渐扩大,花茶的销量也随之增加,在众多的产
和田市历史文化底蕴深厚、地理位置特殊,曾是古丝绸之路南道重镇。团城历史街区作为和田市老城原址,不仅记载着当地历史文脉。同时充分反映着地域特色、地理特征、气候条件等生态环境特点,形成了干旱区独特的街区形态。“一带一路”建设将给和田带来前所未有的发展机遇,同时也会存在相应的挑战。在发展经济的过程中需要明确团城历史街区在城市发展过程中的定位,以保护的思想促进发展得理念,不仅可以增加城市的文化综合实力,同
社会不断进步,城市规模持续扩张,人们需要更加便利的出行条件。交通网络得益于强烈的出行需求而快速发展。不少建筑物在交通荷载引发的环境振动作用下,在安全性和舒适性方面出现问题。本文研究的居民楼在居民区和工业区混合区中,居民楼所在区域地基属于软土地基,加之经常有重型车辆通过,而且居民楼临近街道,所以楼和楼中的居民每天多次遭受车致振动的作用。过度的环境振动可能对建筑物安全性和舒适性造成不利的影响,我们需要