一类基于随机线性两步法的动量随机梯度下降法的收敛性分析

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:zxy556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机微分方程已成为各类随机梯度下降法的一个重要研究手段,例如经典随机梯度下降法可以看成某个随机微分方程的Euler-Maruyama方法,动量随机梯度下降法与随机Nesterov方法可以看成是某个随机微分方程组的近似.本文的目的在于提出一种基于随机微分方程数值方法收敛性的研究框架,用于分析这些梯度型随机优化算法.这些随机优化算法主要包括:带动量的随机梯度下降法和随机Nesterov方法,随机方差缩减算法以及带动量的随机方差缩减算法.对于带动量的随机梯度下降法和随机Nesterov方法,我们采用随机线性多步法的分析框架.首先分别构造了与之近似的随机线性两步法,证明了一定条件下随机线性两步法稳态分布的存在唯一性.接下来,通过研究这两种随机线性两步法与随机Euler-Maruyama方法所得数值解的期望之间的误差来研究这两类加速方法与随机梯度下降法的解的逼近关系,证明了数值解进入稳态之后的收敛性.最后,对这两类加速方法比随机梯度下降法更快地达到最优解做出了理论解释.随机方差缩减算法可获得比随机梯度下降法更小的方差,本文基于时滞思想构造了与之近似的带时滞项的随机Euler-Maruyama方法,证明了该方法稳态分布的存在唯一性,并证明该方法与随机Euler-Maruyama方法之间的收敛性.对于带动量加速的随机方差缩减算法,本文构造了带时滞项的随机线性两步法,并引入片段过程证明了这个带时滞项的随机线性两步法的稳态分布存在唯一.最后,对这类加速方法比随机方差缩减算法更快地达到最优解做出了理论解释.本文的主要创新点在于:基于求解随机微分方程的线性两步法构建了一种分析随机梯度下降法及其多种改进算法的统一框架,为随机优化算法的理论分析提供了一种可行的途径.
其他文献
合作是动物在社会生活中普遍而重要的行为,扩散的捕食-食饵模型和两物种竞争模型都在合作的影响下产生出非常丰富的动力学行为,并对生态学产生重要的影响.本文主要研究了三类带有合作项的反应扩散方程.一类是在齐次纽曼边界条件下,食饵因捕食者的合作狩猎行为而产生了恐惧效应的捕食-食饵模型.首先介绍非空间模型的动力学行为,包括解的有界性,系统的一致持续性,平衡解的存在性和稳定性.然后是对反应扩散系统的分析,包括
学位
1973年Black和Scholes提出了著名的期权定价模型,但该传统模型的假设比较苛刻,没有考虑市场的波动性和交易成本等.为了更加符合市场需求,有的学者考虑了市场的波动性提出了跳-扩散期权定价模型.在上述模型基础上,考虑交易成本,有些学者又提出了更加符合实际的跳-扩散模型下带交易成本的期权定价模型.该模型是一个含有非局部积分项的非线性偏积分微分方程(PIDE).本文主要研究内容为两部分:第一部分
学位
设f:X→P1是定义在复数域C上的g ≥ 1的非常模半稳定纤维化,s是f的奇异纤维条数.众所周知,纤维化中奇异纤维数量是有限的.Szpiro提出了纤维化奇异纤维最少有多少条的问题.针对这一经典问题,Beauville证明了 g ≥ 1时s ≥ 4,并猜测g ≥ 2时,s ≥ 5.这一猜想由谈胜利证明.谈胜利,涂玉平和Zamora证明如果曲面小平邦彦维数非负,那么s ≥ 6.谈胜利还猜想如果亏格g充
学位
Bergman空间是复分析、泛函分析和算子理论的交叉领域,具有丰富的理论体系.本学位论文研究在上半平面上与Dunkl算子相关的一类广义调和函数组成的Bergman空间(λ-调和Bergman空间).Dunkl算子是一类带有反射项的微分算子,利用Dunkl算子定义的广义调和函数(λ-调和函数)展现了与经典调和函数相近的某些优秀性质,但又具有不同的结构,为相关问题研究带来困难.本文的主要结果包括:一、
学位
平均曲率流是重要的几何流之一,平均曲率流的预定夹角边值问题是偏微分方程中的一类重要的边值问题,也是本领域许多数学家一直关注的一类问题.本文主要考虑两维有界区域上一类抛物平均曲率型方程的预定夹角边值问题的解的长时间存在性和渐近行为.首先,我们利用极大值原理的方法证明了在凸区域和非凸区域两种情形下的两个一致梯度估计;其次,作为梯度估计的应用,给出解的长时间存在性;最后,对预定夹角与无关的情形,我们得到
学位
本文研究内容属于凸几何分析中的几何断层学理论.重点研究该理论中的低维Busemann-Petty问题,并将其推广到对数凹函数上.主要研究内容包括i-相交函数,i-相交体,BP体以及对数凹函数上的低维Busemann-Petty问题.具体研究成果如下:1.在N.Fang和J.Zhou定义的相交函数的基础上,为研究对数凹函数上的低维Busemann-Petty问题,我们相应地定义了i-相交函数.同时,
学位
多项式在非交换代数上的像是非交换代数的一个重要研究方向,它起源于著名的Lvov-Kaplansky猜想:域K上未定元不可交换的多重线性多项式在全矩阵代数Mn(K)上的像是向量空间.到目前为止,此猜想仅在一些特殊情况下得到解决.在解决Lvov-Kaplansky猜想的同时,人们开始研究此猜想的各种变型.目前多项式在上三角矩阵代数、Lie矩阵代数、分次矩阵代数、四元数代数等代数上的像都有许多研究成果产
学位
数字图像作为人们日常生活中一种常见的信息载体,因其直观性、综合性以及生动形象性被人们广泛接受与使用。数字图像信息与其他文本信息一样,在传输过程中面临着巨大的安全性风险,又因其数据量大,冗余性高等特点使得其的加密方法与其他文本信息加密方式存在一定差别,传统的加密技术很难做到数字图像在传输过程中同时具备安全性与高效性。目前,图像加密的基本思路是将具有有用信息的明文图像经过加密算法后得到从视觉上无意义、
学位
作为求解偏微分方程的一种重要的数值方法,谱方法以其高精度的特点被广泛应用.本文采用Galerkin谱方法研究正方形区域上带Neumann边界条件的Gray-Scott方程.首先我们介绍了 Jacobi多项式以及广义Jacobi多项式的定义与性质、二维向量值函数的基函数展开,并引入标量值和向量值空间的投影,推导出投影的误差估计.接着,我们选择合适的广义Jacobi多项式作为基函数构造了 Gray-S
学位
Volterra积分微分方程是一类重要的数学模型,来源于物理、化学、生物和金融等众多领域.近几十年来,有关Volterra积分微分方程数值解法的研究取得了巨大进展,已涌现出各种行之有效的数值方法.由于Galerkin型方法格式灵活且具有高精度,它已成为求解Volterra积分微分方程的重要方法之一.本文重点考虑求解非线性Volterra积分微分方程的连续和间断Galerkin方法,旨在通过对已有的
学位