神经网络隐层节点的稀疏化

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:scratch2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文利用最近这些年非常流行的L1/2正则化方法研究BP神经网络的结构稀疏化。我们在传统的平方误差函数中引入L1/2正则项并且在训练过程中对连接输入层和隐层节点的权值向量的L1范数进行惩罚,构造了一种改进的L1/2正则化方法。改进的L1/2正则化方法能够在不影响网络的分类能力和逼近能力的基础上得到更加稀疏的神经网络。同时,我们将改进的L1/2正则化方法和光滑化的L1/2正则化方法进行了实验比较,实验结果表明了改进的L1/2正则化方法的收敛性、稀疏性和优越性。  本文一共分为四章。第一章简单介绍了神经网络的相关理论知识和发展历程。第二章介绍了正则化框架和几种正则化方法,并由此引出了L1/2正则化方法。第三章以第一章和第二章为基础,介绍了如何将正则化方法用于BP神经网络的改善,具体介绍了 L1/2正则化批处理梯度法并将其做了改进。最后,在第四章中,我们进行了相关的数值试验并给出结果。
其他文献
Markov-Feller算子是在Feller过程(一类Markov过程)的研究中出现的一类算子,起源于离散时间的时齐Markov链的遍历性质的研究.Markov-Feller算子的遍历理论已经被广泛地应用到
2013年9月4日—5日,质检总局局长支树平在贵州调研考察时,要求贵州出入境检验检疫局抓住机遇,乘势而上,加强自身建设,服务地方发展,走出一条具有中国特色和内陆特点的强局之路。近年来,贵州出入境检验检疫局紧紧围绕这一目标,一手抓业务、一手抓队伍,强局之路初见成效。但贵州地处西部内陆腹地,产业基础相对薄弱,对外贸易体量不大,检验检疫强局建设还有一段很长的路要走。面向未来,如何准确把握世情、国情、省情
本文研究的内容主要分成两部分。   在第一部分中,我们研究了一维奇异摄动对流扩散问题的指数拟合局部间断有限元方法。由于奇异摄动问题的解通常含有边界层,如果我们用标准
本研究基于Briand等人提出的思想,利用信息流的弱收敛以及随机分析的观点,采用二项离散法,用对称随机游走逼近Brown运动,对一类非线性倒向随机常微分方程,采用左端点离散格式,分析
不变子空间问题是泛函分析当中经典问题之一,本文首先是对相关的历史背景做了简单介绍,然后主要对Banach格上的两类算子--L-弱紧算子与M-弱紧算子的不变子空间进行研究,最后引入