基于随机梯度下降的快速收敛算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jakey17866747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字信息化和大数据背景下,大规模机器学习的核心之一是研究收敛速度快、计算复杂度低的数值优化算法。由于数据规模的增大和机器学习模型参数规模的增加,确定性的数值优化算法存在着存储和计算上的局限。随机梯度下降(SGD)算法由于其简单易于实现、计算代价低、可扩展性强等特点,广泛应用于求解大规模机器学习的经验风险最小化问题。然而,由于随机采样的引入,随机梯度的噪声方差导致SGD算法收敛速度慢,在实际优化求解过程中需要大量的迭代计算。理论上,SGD在一般凸目标和强凸目标的随机优化中分别取得了O(1/∈2)和O(1/∈)的计算复杂度。机器学习的研究者们提出了AdaGrad、Adam等随机梯度算法的改进,这些方法在实际应用中因性能优越、适应性强而被广泛采用,理论上取得加速的收敛速度和O(1/√∈)的计算复杂度,然而在理论层面上与最优的计算复杂度仍然差距甚远。为了提高SGD的收敛速度和计算复杂度,机器学习的研究工作聚焦于SGD算法的改进,提出了一系列SGD的加速算法,包括基于步长选择策略、二阶梯度信息、随机梯度方差减小、动量加速、多阶段框架等的SGD加速算法。
  本文在针对凸目标函数的SGD算法相关研究的基础上,结合自然梯度、随机二阶优化、随机梯度方差减小技术、动量加速和多阶段SGD加速等方向,从信息几何、二阶梯度信息加速、基于方差较小的随机梯度下降的动量加速、多阶段随机梯度下降的动量加速、非强凸目标优化算法计算复杂度的降低等方面展开研究,完成了以下创新性研究工作:
  1.从信息几何领域引入自然梯度下降方法到随机优化中,并从两个角度给出了随机自然梯度下降方法的收敛率分析。首先从随机优化的角度讨论了随机自然梯度下降方法的收敛率,其次在证明自然梯度下降方法与镜面梯度下降方法的等价性后,通过对镜面梯度下降方法的收敛率分析间接得到随机自然梯度下降方法的收敛率结果。
  2.结合方差减小的随机梯度下降和二阶随机优化方法,提出了随机方差减小的子采样牛顿(S2NMVR)算法框架。对于许多机器学习问题,子采样牛顿法利用海森-向量乘积技术,使得算法框架在二阶信息的估计上能够降低计算代价。在此算法框架下,本文提出了S2NMVR的两个变种算法S2DNMVR和S2DQNMVR,对于非线性目标函数的优化,最大程度地保留海森信息并降低海森-向量的计算开销。当目标函数是μ强凸和L光滑的,算法取得了线性的收敛率和O((n+L/μ)log(1/∈)的复杂度。
  3.在方差减小的随机梯度下降算法基础上,结合Nesterov动量和Katyusha动量加速技术,提出了一种随机双加速的动量方法,其中Katyusha动量的引入用来消除加速算法对批量设定的依赖性,Nesterov动量的引入使得加速算法更加稳定。对于一般随机凸优化问题,证明了算法取得了加速的收敛率和O(n√1/∈+√nL/∈)的计算复杂度。针对稀疏数据的优化问题,提出了基于懒惰更新技术的算法进行迸一步加速。
  4.在多阶段的随机梯度下降算法中,提出了基于动量的多阶段SGD加速算法,MAGNET。在多阶段的框架下,算法引入了一种磁铁动量来加速阶段性的SGD方法,消除了基于其它动量加速的SGD更新不稳定性,而且该算法的动量因子选择不依赖于随机梯度的噪声方差和阶段间的误差精度信息。该算法对一般随机凸优化问题,取得了O(√nL/∈+nσ2/L∈)的计算复杂度。
  5.对于非强凸目标函数优化问题,提出了一种激进正则规约方法,在多阶段的框架下通过对目标函数增加自适应的正则化项,将非强凸的目标转化为强凸目标优化。理论上,该规约方法消除了计算复杂度的非最优对数因子log(l/E),降低了非强凸目标优化的计算复杂度,使得收敛率的上确界更加紧凑。相对于其它规约方法对初始化正则系数的依赖,该规约方法对正则系数的初始化更加鲁棒。
其他文献
摘 要:随着现代社会人们对环境质量要求的不断提高,园林得到了持续的发展。然而,在这种良好的发展势头之下,一些问题也突显出来,其中比较明显的一点就是色彩设计问题。色彩景观是构成园林的重要部分,其不足会对整个园林的设计产生影响。基于此,本研究分析园林色彩景观设计的影响因素,并就色彩景观如何应用于园林设计中提出几点建议,为园林设计者提供参考。  关键词:色彩景观;园林设计;应用  一、色彩景观概述  色
期刊
摘 要:随着社会经济的不断完善与发展,人们开始对文化修养与传播提起了重视,而公共图书馆作为文化、信息传播的主要场所,肩负着重要的责任。并且,文化知识的培养要从小做起,一些公共图书馆的从业人员,不断对绘本推广工作进行大胆尝试,以期能够为儿童的培养探索出一条新道路。基于此,本文对绘本阅读推广工作的重要性以及优势进行了分析,并提出了一些有效的措施,以期对相关人员有所帮助。  关键词:公共图书馆;绘本阅读
期刊
摘 要:英语教学与其它学科不同,具有独特性,其中,初中英语阅读教学是初中英语教学中的一个重点,也是一大难点,本文对初中英语阅读教学进行了反思,并对发现的问题推出了针对性的建议,希望对提高初中英语阅读教学水平有所帮助。  关键词:初中英语;阅读教学;反思;探索  英语阅读可以扩大学生的知识面、词汇量,使学生的英语应用能力得到提高,是初中英语教学的重点内容之一,但是,通过对以往初中英语阅读教学的反思,
期刊
摘 要:案例教学法在教学中应用很多,但不同授课类型运用是不一样的。本文结合《国际贸易实务》课程,针对案例讲解相关知识点,说明案例教学法在该课程中的运用,帮助学生理解并掌握一些核心知识点。对于学生今后从事相关业务操作有一定指导作用,对其他课程教学有一定参考作用。  关键词:案例教学法;国际贸易实务;索赔;还盘  一、索赔案例  比如讲授索赔这一章节内容时,首先要明确索赔的定义。索赔是指国际贸易业务的
期刊
摘 要:对于液化天然气(LNG)接收站来说,排水口位置的选取具有十分重要的意义,其不仅关系到接收站整体布局的合理性,还关系到接收站运行的经济性。本文从LNG接收站的取排水工设计入手,对其需要考虑的因素进行分析,以期为接收站的正常运行起到保障作用。  关键词:液化天然气接收站;取水口  当前环境形势日益复杂,世界人民都在广泛的关注环保工作的新进展,我国政府为了适应这一发展形势,开始进行新能源的应用推
期刊
摘 要:本文主要是介绍风洞驻室设计及分析和驻室安装,用应力有限元分析软件Abaqus对整个风洞的驻室结构进行了应力分析,然后就应力分析结果进行了设计选型。对重点部位进行安装介绍和提出安装精度要求,对风洞制造提供可靠的参考依据。  关键词:驻室;承力墙;Abaqus;应力分析;驻室大门  驻室是风洞中进行试验的主要部分,由驻室壳体、承力墙、固定及导向支座、电动大门、转接段轨道、充气密封系统、电动大门
期刊
摘 要:改革开放以来,我国经济取得了巨大的发展,同时城镇化进程也加快了脚步,人们居住条件有了改善的同时,也面临着越来越严重的城市污染问题,生态也被严重破坏,这已经威胁到了居民的生活健康。因此,城市人居环境问题已经引起了社会各方面的关注,建立一套系统科学的城市人居环境评价体系已经十分有必要了,这对于调控人居环境发展,促进城市人居环境可持续发展非常有必要。  关键词:城市人居环境;指标体系;评价方法;
期刊
摘 要:文化站在现代社会文化传播方面具有非常重要的作用,文化站是我国政府在各地建设的文化基础设施,主要汇集了文化学习,文化传播,文化培训等各方面。我国法律规定,文化站为国家文化传播的重要载体,必须秉承为人民服务的宗旨,促进社会主义发展。但是从当前的情况来看,我国很多城市的文化站在群众中都很难发挥全部作用,并且这种趋势越来越明显。本文对文化站在群众文化中的作用进行了分析,并提出了一些改进意见,以推动
期刊
摘 要:在舞蹈艺术中,气息是必不可少的一部分,舞者只有掌握气息的合理运用才能在表演中将舞蹈的美充分表达出来。舞者气息不同,表达出的感情也是不同的,在舞蹈艺术中合理运用气息是极其重要的。本文首先阐述了舞蹈艺术中运用气息的重要意义,其后分别论述了气息在古典舞、现代舞以及民族舞中的运用,以供参考。  关键词:舞蹈艺术;气息;运用;重要性  气息在很多的艺术表演中都发挥着重要的作用,例如演唱、舞台剧、舞蹈
期刊
摘 要:伴随着科学技术的发展,计算机广泛应用于各行各业,各行各业急缺有能力的计算机人才。在这种背景下,各大高校越来越注重计算机人才的培养。高校机房是计算机人才实践的地点,因此,如何管理和维护好高校机房成为关键一环。本文主要阐述了高校机房在计算机教学的重要性,高校机房维护管理中存在的问题并有针对性的提出了解决对策,以期待对高校机房管理维护工作有所裨益。  關键词:高校机房;管理维护;解决对策  一、
期刊