【摘 要】
:
神经网络因其在非结构化数据上的优异表现而被广泛应用于图像、语音、自然语言处理等领域。然而神经网络理论基础目前相对薄弱,其诸多现象与问题并没有较好的理论支撑与解释,也因此成为了研究的热点与难点。神经网络理论研究的关键便是找到其独特泛化表现的理论依据,如为什么过参数化的神经网络模型依然保有较好的泛化能力。解释神经网络泛化误差二次下降现象,便是神经网络泛化性能研究中的一个重要组成部分。传统机器学习理论中
论文部分内容阅读
神经网络因其在非结构化数据上的优异表现而被广泛应用于图像、语音、自然语言处理等领域。然而神经网络理论基础目前相对薄弱,其诸多现象与问题并没有较好的理论支撑与解释,也因此成为了研究的热点与难点。神经网络理论研究的关键便是找到其独特泛化表现的理论依据,如为什么过参数化的神经网络模型依然保有较好的泛化能力。解释神经网络泛化误差二次下降现象,便是神经网络泛化性能研究中的一个重要组成部分。传统机器学习理论中的偏差方差分析指出,随着模型的复杂度不断增加,虽然其偏差在不断下降,但是方差会不断上升,从而导致泛化误差呈现出先下降再上升的趋势。然而,神经网络的泛化误差有时会出现二次下降现象,即神经网络泛化误差随着模型复杂度的增加首先呈现经典的U型曲线,但后期却又会再次下降。最近研究人员发现,二次下降现象同样还出现在了训练过程中:随着训练回合数的增加,神经网络在测试集上的误差先下降,然后到达早停点后由于过拟合开始上升,最后在某个训练回合又会再次下降。神经网络这些现象都与传统的机器学习理论相违背,需要新的理论来解释其泛化能力的独特表现。该论文研究了训练回合增加情况下的泛化误差二次下降现象。首先我们分析了分段线性神经网络片状输出地形的几何特性,论证了神经网络输出地形复杂度与其泛化能力之间的紧密联系。考虑到片状输出地形分析的局限性,我们提出了一种新的计算输出地形频谱的方法来解释神经网络泛化误差二次下降现象。过去的研究表明神经网络具有频谱偏好,即模型在训练过程中会从低频到高频地拟合目标输出地形。然而我们的研究表明,频谱偏好的单调性并不总是成立,而正是这种非单调性引起了模型泛化误差的第二次下降。为了进一步验证这种非单调性,我们对训练过程中神经网络的泛化误差进行了偏差方差分解。实验发现方差项并非如传统机器学习理论所说那样持续上升,而是会在训练后期由增加变为下降,进而使得模型泛化误差二次下降。基于该分析,我们提出了一个新的指标来度量方差项的引入程度。该指标能够仅在训练集上进行计算,但其变化趋势却能与泛化误差保持一致,也因此该指标可以在不使用校验集的情况下指示早停点。该论文反驳了过去研究假定的学习偏好单调性,从实验上证明了正是非单调变化的学习偏好导致了神经网络泛化误差二次下降这个反常现象的出现。该研究对神经网络泛化性能的研究起到了一定的积极作用。
其他文献
近几十年来计算机视觉技术飞速发展,自动目标识别技术在民用军用中的作用也日益突出,在行人检测、智能驾驶、无人机作战等实际场景中均得到了广泛应用。随着自动目标识别技术的发展,如何综合地评价基于不同模型的目标识别算法的性能,是实际应用中十分重要的问题。本文针对自动目标识别算法的性能评价问题,以一些目前主流的自动目标识别算法为对象,设计了一套性能评价指标体系,并提出了一种性能评价方法,对目标识别算法在行人
形状匹配问题是形状识别、形状检索、形状模型重建等关键技术的研究基础,主要可分为刚性形状匹配与非刚性形状匹配。其中,非刚性形状匹配问题由于受到复杂变形因素的影响,实现匹配难度更大,也更具有挑战性。传统的非刚性形状匹配算法,大多基于手工设计的特征描述子,通过特征之间的相似性度量来实现。然而在形状拉伸、扭曲、等距变形等复杂变换影响下,手工设计特征往往存在区分性差、鲁棒性低等问题。近年来,深度神经网络由于
<正>2020年初,新冠肺炎疫情爆发,对全球民航业带来前所未有的巨大冲击,必将深刻影响未来发展格局。现就疫情之后全球航空业的发展情况进行分析。全球航空业发展基本特性特性1:从历史数据来看,全球民航市场发展与经济社会发展速度、发展质量紧密相关,平均年增长率约为全球GDP平均年增长率的2倍或以上,在经济稳定发展时期民航增长也保持稳定态势,但经济波动时民航的波动幅度远大于经济波动(如图1),堪称经济的"
目标检测是计算机视觉研究领域的一个基础课题,在自动驾驶,工业制造以及医疗等应用领域也有重要的应用价值。其中,目标的定位精度不仅仅是衡量目标检测的重要指标,对其应用也有显著的影响。本文以经典的Faster R-CNN为例,从样本分配、网络结构以及损失函数三个角度出发对模型进行分析和改进,以提升模型的定位精度。主要研究工作简述如下:(1)提出了基于动态样本分配的目标检测算法。原始的目标检测算法通常是基
锂电池因具有高功率密度、无记忆效应、使用寿命长等优点,在军事、交通、电站等领域具有广阔的应用前景。为了满足实际使用中不同的功率需求,通常将单体电池进行串并联连接形成电池组。对电池组中发生异常衰减电池进行定位处理,是保障储能系统高性能安全输出、避免故障甚至危险的关键。为此,本文针对电池组中异常衰减电池从识别定位、状态估计和维护决策三方面展开深入研究,旨在系统性地解决电池组中异常电池的精确定位、估计和
多视图数据是指对同一物体从不同视角进行描述的多个特征子集。充分挖掘视图间的一致性和互补性信息,对来源不同的特征子集加以融合进而做出更合理的决策是多视图学习的主要目标。典型相关性分析(CCA)是多视图学习中的重要方法,旨在为各视图寻找一个公共子空间以最大化视图间的相关性。传统的CCA方法只能处理两个视图的线性关系,无法应用于包含多个视图的、非线性的数据集。如果将CCA作为一种降维方法应用到分类、回归
神经接口能够提供神经系统与外部设备之间的信息交流通道,是一种在恢复瘫痪病人感觉和运动功能方面具有巨大潜力的新兴技术。其中,植入式脑机接口是当前最前沿的交叉研究领域之一,有许多问题亟待解决。在神经信号编解码方面,由于神经信号具有非平稳特性,不同时段的神经信号数据存在统计分布差异,经由历史数据训练的解码器往往不能准确解码当前数据,因此脑机接口用户需要采集大量新样本用于解码器的重校准,这为用户带来沉重负
宫颈癌是常见妇科恶性肿瘤之一,对其进行定期筛查并及时治疗能有效降低女性因患宫颈癌的死亡率。宫颈细胞学筛查方法需要病理医生从宫颈脱落细胞涂片上的数十万细胞中筛选出异常细胞并做出宫颈病变程度的诊断。随着阅片量增加,人工阅片方法容易因为医生视觉疲劳造成误诊。宫颈癌细胞自动检测方法能够辅助医生诊断,提高阅片效率和准确度。现有的宫颈癌细胞检测算法在如何挖掘阴性图片中的难负样本,如何采样更具代表性的候选框样本
固体氧化物燃料电池(Solid Oxide Fuel Cell,SOFC)系统是一种使用燃料来发电的装置,具有低排放、高效率、长寿命的优点。然而,振荡的发生和传播在系统中是很常见的。当某些变量振荡时,发电系统的寿命会大大缩短,并且会影响系统的输出电特性。因此,为了防止振荡对系统造成不良影响,SOFC系统振荡根因分析、诊断和控制是非常重要的。一个独立的SOFC系统由多个子系统组成,每个子系统均包含多
功率变换器是实现电能高效利用的核心设备,被广泛应用于电动汽车、航空航天、新能源、数控机床、化工冶炼等领域。随着科技水平的不断提升和人类对生存环境的不断探索,日益恶劣、复杂的工况对功率变换器可靠性要求越来越高。故障诊断技术是提升功率变换器可靠性的重要手段,其对故障器件进行检测与定位,从而为维护决策、容错控制提供依据,保证了设备的安全性、可靠性、经济性以及无人化作业的能力。本文以三相四线T-type整