一类用于训练神经网络的方法及其应用

来源 :兰州大学 | 被引量 : 0次 | 上传用户:nikecb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络的训练可以被认为是需要考虑泛化的高维非凸最优化问题。从最优化的角度考虑,训练算法的收敛速率和适用性是被关注的重点。从泛化角度入手,神经网络在测试集上的表现很重要。从这两个角度出发,本文提出了一类用于训练神经网络的方法,并将这些方法应用于乳腺癌诊断/预后、扁平足诊断和图像分类任务中。本文主要开展了如下三方面的工作。(1)为提升伯恩斯坦多项式神经网络(Bernstein polynomial neural network,BPoly NN)的泛化性能,本文提出有序岭回归方法。在嵌入了有序岭回归的BPoly NN(BPoly NN with ordered ridge regression,BPoly NN-O)提取的特征中,低频成分占主导。本文通过仿真验证了有序岭回归方法在不同维度下的有效性。此外,BPoly NN-O被应用到乳腺癌诊断/预后中。相应的实验结果表明,BPoly NN-O的泛化性能优于原始Bpoly NN和参与比较的常用机器学习模型。(2)为提升神经网络的训练精度,本文提出多重伪逆方法。与BPoly NN等基于伪逆训练的神经网络不同,多重伪逆方法将神经网络中的所有参数迭代地训练,且只需少量迭代即可完成训练。为验证多重伪逆方法的有效性,进行了数值仿真。基于多重伪逆方法,构建了多重伪逆神经网络(Multiple-pseudo-inverse neural network,MPNN)。在此基础上,本文将MPNN应用到扁平足诊断中,并进行了MPNN与其它常见神经网络的对比实验。实验结果表明,MPNN在该扁平足诊断任务中具有优良的性能。(3)为提升深度神经网络的泛化性能,本文提出了对损失曲面变形以诱导优化器跳过尖锐极小值点的方法。此外,通过定义普遍意义上的形变映射,为从多个角度提高优化性能提供了可能。本文还设计了用来促进泛化的垂直形变映射(Vertical deformation mapping,VDM),并从理论上证明其在低维和高维情形下均可滤除尖锐极小值点。基于二维情况下的仿真,由观测到的海森矩阵特征值可知VDM可以诱导优化器跳过尖锐极小值点。此外,本文还验证了直接增加学习率不能替代所提出的方法。本文将VDM嵌入到卷积神经网络中,并进行了对损失曲面的可视化实验。该实验结果表明,使用了VDM的网络可收敛到更平坦的区域。将VDM应用到图像分类任务后,在CIFAR和Image Net上进行的比较实验表明VDM可以提高多种卷积神经网络在图像分类中的泛化性能。
其他文献
随着智能手机、平板电脑以及其它触屏设备的广泛使用,在多点触控设备上进行文本输入变得很常见。在触控屏上现有的输入方式是通过虚拟键盘进行的。在物理键盘上通过触摸F键和J键的凸起,普通人可以进行高效的盲打输入,盲人也可以有效地使用键盘输入。但通过触摸屏上的软键盘盲打输入却无法实现盲打输入,相对于在物理键盘上普通人的输入效率就会大大降低,对盲人来说输入操作就会变得更加困难。本文在先前关于多点触控设备上适用
图像分割技术是由图像处理到图像分析的关键步骤,也是计算机视觉研究领域中的经典难题。其中,GrabCut作为一种基于图论模型的马尔科夫随机场能量最小化图像分割算法,因其只需少量交互就能得到较好的分割结果而在彩色图像分割领域中占有重要地位。然而,GrabCut仅通过像素颜色值的差别建立模型,对噪声干扰敏感,且交互式的分割方法需要人工参与,无法广泛应用于各个领域。因此,本文的工作将围绕如何改进以上问题展
目前,互联网技术飞速发展,高校校园网的建设也紧跟时代发展的脚步。然而,网络的快速发展也带来了各种安全问题,如何准确快速识别出网络流量中的异常流量成为网络流量监测与分析研究方向的重点。校园网用户数量的不断增加,校园网网络流量爆炸式地增长,对校园网络流量的监测与分析难度也大大提升,现有的校园网网络流量监测系统难以应对日益复杂的各种流量攻击方式。本文根据新时代校园网网络流量监测的需求,设计出一套集校园网
生态数据有利于政府和相关学者揭示和预测生态环境变化,而当地生态部门与生态科考的数据具有数据分散和共享性差的特点,导致搜寻数据的时间成本较高。随着数据不断增多,数据的维护和管理工作也变得困难,部分数据的丢失问题也时常发生。网络爬虫技术不断的发展威胁到系统的稳定性和数据的安全性,它可以低成本且大规模的爬取互联网中的数据,给数据的安全问题带来了不确定性。目前,网络爬虫在互联网中的流量达到了历史最高水平,
群智能优化算法是一种随机优化算法,是受到自然界中生物群体行为的自优化现象的启发而提出的一种元启发式算法,主要包括粒子群优化算法、蚁群优化算法、人工蜂群算法、萤火虫算法、灰狼优化算法和鲸鱼优化算法等。群智能优化算法具有结构简单、稳定性高、支持并行计算等特点,适用于大型且问题复杂度较高的场景。因此,群智能优化算法一直是研究者们关注的重点。文章中基于麻雀搜索算法提出了三种改进方法,利用基准测试函数设计了
校园网是为包含职工、教师、学生等很多网络用户提供教学、科研和综合信息服务的宽带多媒体网络,具有实现资源共享、信息交流、协同工作等基本功能。校园网日志分析系统是实现校园网安全防护工作的有力手段,通过使用开源的一些系统架构,管理员可以根据校园网运行情况因地制宜修改配置相应的参数,根据需求编码相应的代码,从而实现对网络日志数据的存储、分析、挖掘以及结果可视化一站式处理,辅助日常网络运维工作。本文通过采用
人文科学和社会科学研究有助于理解重大社会问题并找到解决方案,对人文社科开放获取基础设施建设的研究可以促进人文社会科学的发展。我国人文社科开放获取基础设施建设比较少,需要借鉴国外的理论实践经验。本文首先选取了欧洲四大同类典型性项目(欧洲开放科学云EOSC、开放获取出版项目OAPEN、公共语言资源与技术基础设施项目CLARIN、开放获取基础设施项目OPERAS)通过网络调查法对比分析四大典型性项目的平
农业是支撑国民经济建设和发展的基础产业,作为稳民心、安天下的战略性产业与我们每个人息息相关。甘肃省地处我国西部落后地区,自然条件相对恶劣,生态环境较为脆弱,经济发展滞后,贫困人口又相对集中,仅仅依靠传统农业种植很难实现脱贫致富和乡村振兴,与时俱进实现农业现代化至关重要。甘肃省白银市白银区强湾乡是典型的传统农业区域,曾有接近全区半数贫困村聚集于该乡镇,亟需通过加强政府扶贫政策支持、提高乡镇自身脱贫致
随着智能信息社会的发展,科学信息数据的复杂性也与日俱增,最具代表为数据类型以康托尔集转型为模糊集合,则如何科学的将模糊性、不确定性、复杂性、不完备性、不精确性的科学信息数据处理为知识或人类需要的决策信息是现代学者必须面对和解决的问题之一。粗糙集理论的问世代表人们开始以不同于其他处理信息数据工具的思维来看待和整合信息数据,不再需要任何先验知识对信息数据归类或预判,而是基于数据之间的客观关系进行数据类
全球工业化进程加快,全民生产率提高,碳排放量不断攀升,经济增长的同时也提高了全球发生极端天气的频率,如近期我国南方洪涝灾害等频发。于是越来越多的国家意识到环境保护的重要性,开始平衡经济与环境间的关系。2020年欧盟提出了“碳边境”计划,针对碳排放管控力度弱的进口商品进行一定比例的碳税征收,以此来保护环境规制力度大的本土企业,不至于出现“劣币驱逐良币”现象。2021年全国两会期间,中国首次把“碳中和