带光滑正则项前馈神经网络学习算法的收敛性分析

来源 :大连理工大学 | 被引量 : 8次 | 上传用户:ttkuaile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于神经网络强大的非线性映射能力,人工神经网络近几十年来得到了快速的发展。在智能信息处理,模式识别,特征提取,压缩感知等诸多领域已有成功应用。梯度下降法是前馈神经网络常用的学习算法,主要有两种学习方式:批处理和在线学习。但是训练速度慢是反向传播神经网络(BP网络)的一个主要缺陷。已有的研究成果表明,训练过程中,满足逼近精度要求的前提下,较小规模的网络,其泛化表现较好。为了克服BP网络训练速度慢,泛化能力差的缺陷,在更新公式中加入动量项、惩罚项(也称为正则项)是常用的改进办法。已有文献多采用L2形式的惩罚项,起到了压制权值过大增长的目的,而加入动量项则加快了训练速度。但如何能简化网络结构,取得较好的稀疏化效果,降低成本,也是神经网络优化的一个重要方面。最近流行的L1/2正则化方法在稀疏效果方面有着独特的优势。但由于所用误差函数在原点附近不光滑,因此收敛性分析遇到困难。且数值试验显示在迭代过程中出现了振荡现象。为此我们采用光滑化技术,解决了这一难题。本文的研究内容着重于把L1/2正则化方法和动量项方法引入到前馈神经网络学习过程中来,以改进网络性能。同时我们给出算法的收敛性分析。本文的具体研究内容概括如下:1.第一章回顾神经网络相关的背景知识。2.第二章考虑带光滑L1/2正则项的三层前馈神经网络批处理算法的收敛性。首先证明了网络误差函数的单调性,接着给出了改进后算法的强、弱收敛性定理的严格证明。通过光滑化误差函数,克服了非光滑化L1/2正则化算法带来的误差函数、梯度范数在数值试验中出现的震荡现象。数值试验验证了理论结果,并且比较试验显示改进后算法在诸多方面更有优势。3.第三章给出了带光滑L1/2正则项前馈神经网络在线学习方式下的收敛性分析。无正则项时现有文献在关于网络收敛性证明中需要权值有界这一假设条件,但现实中这一条件比较苛刻,无法验证。本文严格证明了带光滑L1/2正则项时前馈神经网络权值学习过程中的有界性,使得证明神经网络算法收敛性的假设条件得到较大程度的弱化。我们还严格证明了该在线神经网络算法的强、弱收敛性。4.第四章研究了带光滑化L1/2正则项和自适应动量项的前馈神经网络算法的收敛性。在学习率为常数的情况下,自适应调整动量项因子,给出了该算法的强、弱收敛性定理,并予以严格证明。
其他文献
目的了解同济医院门诊电子挂号系统在患者中的普及程度、使用效果及存在的问题,为加强门诊电子挂号系统建设提供参考。方法采用问卷调查的方式对门诊患者的电子挂号系统使用
采用PR状态方程及其混合法则对不同配比的二元混合制冷剂CO2/R600的气液相平衡进行了计算,将计算结果与相关文献数据进行了比对。结果表明,该文的计算结果与文献数据吻合较好
为纪念世界反法西斯战争暨中国人民抗日战争胜利70周年,进一步加强中央国家机关党员干部爱国主义教育和党性锻炼,培育和践行社会主义核心价值观,近日,中央国家机关工委通过深
通过工程实例,重点介绍彩钢压型板屋面采光带防水施工细部节点、质量控制要点及防漏水预控措施,旨在提高采光带的防水施工质量,为类似采光带施工提供参考。
时滞现象在实际的工程系统中是普遍存在的,如通讯系统、生物系统、电力系统,化工过程等。时滞的存在是造成系统不稳定的主要原因之一,因此有许多的科研工作者致力于时滞系统
在生态批评视野中,回归应该是一种态度、思维、理念,并最终指导行动。回归并不是简单地回到过去,而是要通过与古代的对话,在历史的回顾中矫正现实的缺陷。具体说来,回归应该
通过对柞水县104处不稳定斜坡的调查分析,发现区内以堆积层不稳定斜坡为主;最有利于不稳定斜坡发育的原始坡度区间为30°~45°,最有利于不稳定斜坡发育的原始坡高区
目的探讨下肢深静脉血栓形成磁共振血管成像(MRA)和下肢深静脉血栓磁共振直接成像(MRDTI)的临床价值。资料与方法对25例临床确诊为下肢深静脉血栓形成的患者进行MRA和MRDTI检查.MR
随着空间技术和超导技术的不断发展,绝缘材料在低温下的电气特性备受关注。针对低温环境中绝缘材料电气性能测试系统,研制了一套采用铑铁温度传感器和铂电阻温度传感器作为感
目的探讨外伤性硬膜下积液转化为慢性硬膜下血肿的机制和临床特点.方法回顾性分析16例外伤性硬膜下积液转化为慢性硬膜下血肿患者的临床资料及相关文献.结果本组外伤性硬膜下