面向图像分类的卷积神经网络损失函数研究

来源 :山东大学 | 被引量 : 5次 | 上传用户：qwer96669

【摘要】

：

图像分类是计算机视觉领域的四大基本任务之一,也是其他三大任务的基础。如何获取更好、更抽象的图像特征表达,是实现图像分类性能提升的关键。卷积神经网络(CNN)作为一种多

【作者】

：

梁聪

【出处】

：

山东大学

【发表日期】

：

2020年01期

【关键词】

：

图像分类深度学习卷积神经网络损失函数特征表达

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像分类是计算机视觉领域的四大基本任务之一,也是其他三大任务的基础。如何获取更好、更抽象的图像特征表达,是实现图像分类性能提升的关键。卷积神经网络(CNN)作为一种多层、非线性的表示学习方法,可以自动提取原始数据的特征表达,相较传统算法性能优势明显,已成为图像分类领域主流技术。在CNN之中,损失函数决定了整个CNN模型参数的更新过程,是决定网络对原始图像提取的特征表达优劣的重要因素。因此,近年来针对损失函数的相关研究已成为CNN模型泛化性能提升研究方面的热点之一。然而现有损失函数相关的研究工作,特别是面向图像分类任务时,仍存在以下不足:首先,现有工作大多聚焦在单一损失函数的模型优化问题上,缺乏对多损失函数协作优化模型的探讨和分析;其次,现有工作主要围绕CNN倒数第二层特征表达的数学特性展开,缺乏对CNN其他层特征表达数学特性的探索分析,在模型性能的理论分析上仍存在一定局限性;再次,现有工作主要应用于人脸识别、图像检索以及行人再识别等任务。这些任务与图像分类在判别准则上存在本质差异,相应研究成果在应用于图像分类任务时,性能增益有限。针对上述研究现状,本文在理论上首次提出了多损失函数需遵循的两个基本准则,设计了新型的多损失函数协作优化框架—损失迁移(Loss Transferring,LT),有效提升了 CNN模型的泛化性能;通过分析CNN最后一层和决策层特征表达的数学特性,在理论层面首次提出了特征表达的位置特性和无偏特性两个新的特性定义,扩展了 CNN基础理论,进一步通过设计全新的损失函数辅助模型实现了上述两个特性,有效提升了 CNN模型的分类性能。本论文的主要创新点具体总结如下:1)面向多损失函数协作优化CNN问题,论文设计了新型多损失函数协作优化框架—损失迁移(LT),将多损失函数协作优化问题转换成多训练阶段的单损失优化问题。LT借助迁移学习理念,将一个阶段从目标对象中学到的“知识”(即模型参数)传递给下一个训练阶段,实现不同训练阶段所学不同“知识”的融合,有效提升了 CNN模型的泛化性能。同时,为解决不同训练阶段损失函数的选择问题,提出了两个基本准则,以此为基础设计了新型的近邻分界面(Near Classifier Hyper-Plane:N-CHP)损失。进而基于所选损失函数差异,提出了LTMSE,softmax和LTN-CHP,softmax两种训练方法。最后在四个代表性数据集和多个不同CNN模型上对所提理论和方法进行了实验验证。实验结果表明了LT能获得显著的性能提升,同时验证了两个基本准则的有效性。2)从理论上分析了 CNN最后一层特征表达的数学特性,提出了 CNN的“位置特性”(Location Property,LP)。位置特性表明在CNN最后一层,提升CNN模型的分类性能等价于寻找最优的特征映射位置。为找到特征空间中最优特征映射位置,提出了两个特征映射方向:主映射方向(Principal Embedding Direction,PE-direction)和次级映射方向(Secondary Embedding Direction,SE-direction),并在理论上证明了“次级最优特征平面”(Secondary Optimal Feature Plane,S-OFP)在SE-direction上的最优性。以两个映射方向为指导,进一步提出了基于位置特性的损失优化框架:LP-loss。LP-loss包含LPPE和LPSE两部分,并可通过这两部实现特征表达沿PE-direction和SE-direction移动。最后在多个不同的CNN模型和四个代表性数据集上对LP-loss进行了实验验证。实验结果验证了位置特性的正确性,同时也表明了 LP-loss能获得显著的性能提升。3)从理论上分析了 CNN决策层特征表达的数学特性,提出了 CNN的“无偏特性”。无偏特性表明提升CNN模型的分类性能需要保证决策层特征表达中对应于错误类别的元素值互为相等。为实现无偏特性,提出了最小化最大概率约束(Minmax Probability Constraint,MMPC)和指数形式的最小化最大概率约束(Exponential Minmax Probability Constraint,e-MMPC)损失。通过对 softmax损失添加额外的MMPC/e-MMPC损失,可以使CNN模型在最大化正确类别概率的同时最小化所有错误类别的概率。此外,通过梯度分析表明MMPC/e-MMPC可在一定程度上缓解CNN模型梯度消失问题。为解决MMPC/e-MMPC带来的副作用,提出了两阶段再训练策略,进一步提升了 MMPC/e-MMPC损失所带来的性能增益。最后在多个不同CNN模型和四个代表性数据集上对MMPC/e-MMPC进行了实验验证。实验结果验证了无偏特性的正确性,同时表明MMPC/e-MMPC能有效提升分类性能综上所述,本文面向多损失函数协作优化CNN模型的问题,提出了损失迁移训练框架。损失迁移框架通过融合多个损失函数的优势,可有效提升CNN模型泛化能力。同时,通过对CNN最后一层与决策层特征表达数学特性的分析,从理论上提出了 CNN的位置特性与无偏特性。在此基础上,以实现位置特性与无偏特性为目标,设计了 LP-loss和MMPC/e-MMPC损失,提升了 CNN的分类性能。

其他文献

基于云计算和虚拟化的计算机网络攻防实验教学平台建设探索

文章主要以基于云计算和虚拟化的计算机网络为主要的探究背景,具体对实验教学的平台建设进行了深入探索。笔者先对计算机信息安全与网络攻防实验教学的现状进行了剖析,在对基

期刊

云计算环境虚拟化计算机技术网络攻防

新加坡国家档案馆的声像档案在线利用

随着声像档案数字化工作的不断推进以及相关信息技术的成熟发展,在线利用声像档案已经成为可能。新加坡国家档案馆在声像档案在线利用方面开展了有益探索,因而作为研究对象,

期刊

声像档案在线利用新加坡档案馆audio-visual archivesonline accessSingaporearchives

绳上的“舞者”——记法尔胜泓昇集团有限公司副总裁、总工程师刘礼华

在长江下游新兴的滨江港口城市江阴,有一家特殊的企业。它以"绳子"为主线,从数万元的作坊起家,赶着时代浪潮,经过了由"麻绳"、"钢绳"到"光绳(纤)"的裂变升级。它的名字是法尔

期刊

副总裁金属制品法尔胜港口城市企业500强时代浪潮长江下游总工程师

闪耀在西北的科技明珠——甘肃武威国家农业科技园区

甘肃武威国家农业科技园区是科技部2013年9月批复建设的第5批国家级农业科技园区,于2015年年底全面建成。园区按照“科技兴园、生态立园、产业带园、开放建园”的方针,以“节

期刊

特色林果业科技成果转化农业科技创新体系国家农业科技园区甘肃武威区域经济社会发展高效产业贮藏加工

宇宙中最离奇的“十大致命”行星

科学家表示,通过对系外行星的研究分析,我们将能更深入地理解地球。尽管这些神秘的系外行星非常迷人,但它们其中所蕴含的秘密却不得而知。现在就让我们走近宇宙中最离奇的“

期刊

系外行星宇宙致命地球科学家

草木有本心生态出良药

“不向农田抢地,不与草虫为敌,不惧山高林密,不负山青水绿”——这样的中药生态农业宣言,萌发于怎样一种初心!“我有一个梦想,就是有一天让中国90%以上的中药材实现生态种植,

期刊

生态农业本心草木中药材生态种植梦想

电子文件在实际应用中的利与弊

社会信息化的高速发展衍生出了许多新产物,电子文件就是其中之一,其具有深刻的社会背景和技术基础。档案管理工作的有效实施一定程度上依赖于电子文件的存储和记忆。就电子文

期刊

电子文件档案管理利与弊electronic documentsarchives managementadvantages and disadvantage

8种杀菌剂对大葱紫斑病及根腐病的室内毒力测定

以天津地区大葱紫斑病及根腐病病原菌为试验材料,采用菌丝生长速率法,研究了天津地区大葱主产区紫斑病及根腐病病原菌对8种杀菌剂的敏感性,以期为该地区大葱紫斑病及根腐病的

期刊

大葱紫斑病根腐病毒力测定

教育缓解相对贫困的实践逻辑与路径选择

教育扶贫是中国扶贫开发总体战略的重要组成部分。2020年后我国扶贫工作的重心将从解决显性绝对贫困转向瞄准隐性相对贫困。教育缓解相对贫困具有一定的合法性。教育不仅是提

期刊

教育扶贫相对贫困长效机制实践逻辑路径创新

宫殿建筑的范本——洛阳宫城

大业元年,隋炀帝下诏迁都洛阳,皇宫紫微城由宇文恺规划设计开始建设。兵夫70万人筑造城墙,60日便已筑成,工速之快乃历代皇宫之最。城内诸殿基、墙院又役10万多人,木工、瓦工

期刊

宫殿建筑洛阳宫城范本世界历史隋炀帝阿房宫皇宫

面向图像分类的卷积神经网络损失函数研究

与本文相关的学术论文