一阶随机优化中的自适应步长理论与应用研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户：neo1997

【摘要】

：

存储能力的提升使得数据的规模和形式成指数形式增长,进而越来越多的领域都提出了对海量数据进行高速处理和分析的要求。一阶优化方法由于其每次迭代所需计算量低和收敛速度

【作者】

：

杨壮

【出处】

：

厦门大学

【发表日期】

：

2018年01期

【关键词】

：

随机优化批处理技术方差缩减 Barzilai-Borwein方法 Nesterov’s加速自适应步长

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

存储能力的提升使得数据的规模和形式成指数形式增长,进而越来越多的领域都提出了对海量数据进行高速处理和分析的要求。一阶优化方法由于其每次迭代所需计算量低和收敛速度快等优势已成为处理这一棘手问题的主流方法。特别是近几年凸优化在信号处理和机器学习等领域需求的急速增长进一步使得一阶优化方法备受关注。而一阶随机优化方法由于其每步迭代所需计算量极小,速度更快和易拓展等优势已成为处理大规模学习问题的主要方法。然而,一阶随机优化方法的这些优势并不是免费获得的。其每次迭代过程中的随机采样策略导致了方差的产生,而方差对随机优化算法产生的最直接的影响就是降低随机优化方法的收敛速率。即使当目标函数具有强凸且光滑这种良好的性质时,传统的一阶随机优化方法也只能达到次线性收敛速率。为了降低方差对随机优化算法产生的影响及保证算法的收敛性,其在运行时通常采用一组递减的步长序列或者预先选定的常数步长。一阶随机优化算法中,不确定的梯度选择方式破坏了搜索空间进而不允许严格的决定序列生成,使得在确定性优化算法中使用的传统的线性搜索策略不能用于随机优化算法中。沿着降低方差这条主线,出现了一批数值效果稳定且具有线性收敛速率的一阶随机优化方法。在这些先进一阶随机优化方法中,最受关注的是引入mini-batching技术的一阶随机优化方法一mini-batch算法。mini-batch算法不仅继承了传统的一阶随机优化算法计算量低、速度快等优越性质,且更易于算法的并行,同时可以有效的降低随机优化算法中由于采样产生的方差。然而,现存的mini-batch算法通常采用与传统一阶随机优化方法相似的步长选择方式:一组递减的步长序列或者预先选定好的常数步长。在运行算法时,使用递减的步长序列会进一步降低算法的收敛速度;而预先选定的常数步长通常需要事先在若干个步长上进行测试择其表现最优的一个,在面对数据规模很大的问题时,这种做法是极其耗时且不可取的。最为重要的是,目前并没有明确的指导原则与理论来说明哪种选择步长的策略更好。本文围绕如何有效、快速的选取mini-batch算法的步长展开工作。主要工作和贡献如下:1.提出 mS2GD-BB 算法。本文提出在 mini-batch semi-stochastic gradient descent(mS2GD)算法中引入Barzilai-Borwein(BB)算法,BB算法可自动计算mS2GD算法的步长。证明了 mS2GD-BB算法的收敛性;分析了 mS2GD-BB算法的复杂度。数值实验证明了所提出算法的有效性。2.提出Random Barzilai-Borwein(RBB)算法,并将其引入到mS2GD算法中,得到mS2GD-RBB算法。mS2GD-RBB算法可获得动态自适应步长。证明了mS2GD-RBB算法的收敛性并分析了 mS2GD-RBB算法的复杂度。大量的数值实验充分证明了 RBB算法的有效性。3.提出基于超梯度的在线步长(Online Step Size,OSS)计算策略并将其应用到 Mini-Batch Nonconvex SVRG(MSVRG)算法中,得到 MSVRG-OSS 算法。证明了 MSVRG-OSS算法的收敛性并分析了该算法的复杂度。MSVRG-OSS算法避免了使用BB算法及RBB算法计算步长时,出现分母为零而导致两种方法失效的情况发生。数值实验证明了 MSVRG-OSS算法的有效性。4.将BB步长和RBB步长引入具有Nesterov加速结构的一阶确定性优化算法和一阶随机优化算法中。分别证明了所提出算法的收敛性并分析了提出算法的复杂度。性质实验和对比实验充分证明了所提出算法的有效性。

其他文献

民国时期天津生活类洋货贸易变迁研究（1912-1937）

天津自1860年开埠以来,逐渐成长为华北地区最重要的进出口港口。至民国时期,天津已经成为中国北方最大的洋货进口港。天津港的贸易数据成为反映华北地区经济的重要晴雨表。本

学位

进口贸易洋货民众生活天津

预处理对丝光沸石吸附性能的影响

研究了丝光沸石预处理条件对其在水溶液中吸附有机物质的影响。实验表明：随着预处理盐酸浓度及温度升高，丝光沸石吸附性能渐增，并在２００℃及２．０ｍｏｌＨＣｌ浓度时达到最佳状态。

期刊

丝光沸石化学需氧量吸附预处理mordenite adsorbabillity polycrystalline X-ray diffraction COD

西湖心像

“最爱湖东行不足,绿杨阴里白沙堤。”是白居易春行钱塘湖时欣然陶然的观景形象,也是他恬静闲适自得的心像。与千年的高士影像耦合,邵大浪用近20年来的黑白摄影表现他的西湖

期刊

构图形式

铁路局调度分析系统的设计与实现

对铁路局调度分析信息化现状进行分析,论述如何利用Oracle存储过程技术,通过网络自动采集列调、计划调、机调、客调、十八点统计等专业调度指挥系统数据进行综合处理,利用JSP

期刊

B/S结构信息系统调度分析系统设计Browser/Server Information System Dispatching Analysis Syst

基于RAROC模型的Y银行信用风险管理研究

信用风险是金融风险中最重要的风险之一,其源于交易双方的信息不对称,会随着信用交易的扩大而变得更加突出和严重。自2007年美国次贷危机以来,企业和监管部门都将信用风险评估和管理置于重要位置。巴塞尔银行监督管理委员会于2010年9月12日启动了《巴塞尔资本协议Ⅲ》,提出了更高的资本要求,商业银行信用风险防范工作可据此框架展开。为了参与全球竞争、融入世界,并跻身世界领先银行之列,中国银行业需要适应巴塞尔

学位

Y银行RAROC模型信用风险风险管理

CaBP4基因突变在常染色体显性遗传夜发性额叶癫痫中的电生理功能研究

<正>目的明确CaBP4基因p.G1 55D突变在常染色体显性遗传夜发性额叶癫痫(ADNFLE)发病机制的电生理功能。方法应用膜片钳技术检测CaBP4基因p.G1 55D突变对海马神经元L型钙通道

会议

一阶随机优化中的自适应步长理论与应用研究

其他学术论文