熵在BP网络泛化增强技术中的应用

来源 :河北大学 | 被引量 : 0次 | 上传用户:liuzhao256
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络是机器学习中最重要的模型之一,它基于无次序、无规则的样本数据集,试图从中提取出描述此样本数据集特征的数学模型。其中,BP神经网络因其结构简单、算法易于实现且理论坚实,能够实现复杂的非线性映射,所以广泛应用于模式识别、智能控制等领域。但是,在BP网络实际应用中也存在一些不足,其主要有收敛速度慢、易于产生过拟合,进而影响了网络的泛化能力。网络的泛化能力也就是对于未见样本的辨识能力,是体现神经网络性能的一个重要指标。提高网络泛化能力的一个指导思想是训练出在训练集能够达到精度要求并且其结构尽可能简单的网络。本文首先研究了网络结构优化算法,通过剪枝的方法在网络训练过程中删去一些不重要的单元和链接。重点分析了在传统的误差函数中加入惩罚项的间接剪枝法。在此基础上,针对网络收敛速度慢、产生过拟合的不足,设计了一种基于信息理论学习的惩罚项函数,通过正则化方法把一些先验知识融入到网络的学习中,旨在提高泛化能力,同时解决训练效率问题。最后,实验比较了传统BP算法,带惩罚项的BP算法以及改进后基于信息熵惩罚项的算法的性能。实验结果表明,本文提出的基于信息熵的惩罚项算法的性能较优,并且训练效率较高。
其他文献
我国大多数注水开发油田采出程度及综合含水指数均已很高。油井大规模采用机械采油方式使得井内流体压力低于饱和压力,产生原油脱气现象,造成油井内油气水三相流动状态。在油田
哼唱搜索(Query by Humming)是一种基于内容的音乐搜索技术,它是涉及信号处理和模式识别等领域的综合研究课题。与传统的基于文本的搜索不同,哼唱搜索为人们提供了一种很自然的
在信息检索系统中,由于用户查询语句过短而导致的词不匹配、信息迷向和信息过载等问题,成为制约检索质量的主要因素之一。实践表明,根据一定的策略为原查询语句附加更多的关键词
随着计算机、互联网、通信以及定位技术的快速发展,科学计算、社会生活及工业生产不断产生出各类复杂数据。这些数据在形态上具有海量、高维、多源、异构、不确定/不完整等特
随着计算机图形处理能力和互联网技术的飞速提高,三维模型的获取和处理愈加方便,三维模型的应用变得越来越广泛。在三维模型处理领域,基于形状的三维模型检索技术和三维模型
近些年来,我国水产养殖业取得了迅速发展,但因为相配套于水产养殖业生产的服务措施相对比较落后,特别在水产养殖动物病害诊断、预防及治疗方面总体上还处于较低水平,水产养殖动物
本文的研究领域涉及计算机图形学、计算科学以及并行计算技术,针对图形学研究领域的一个关键技术——真实感光照渲染理论,引入多尺度配置计算方法,研究并提出基于正交递归二分法
传统的模糊支持向量机中的隶属度是由样本点到类别几何中心的距离来确定的,在较大程度上消除噪声点或孤立点的同时也削弱了类边缘支持向量对分类超平面的影响。直觉模糊支持向
当人们使用搜索引擎在互联网中检索信息时,查询词中会出现拼写错误,这严重阻碍了人们获得其所需信息。这些拼写错误可分为两类:打字错误和认知错误。其中,认知错误是指人们知道某
虽然IPv4对Internet的发展做出了巨大的贡献,并在四十多年的应用中证明了它的健壮性,但是随着Internet迅猛发展,网络规模爆炸式的扩张,IP地址空间严重不足,网络性能变差,路由