基于课程学习思想的图像分类算法

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:king_caspe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类作为计算机视觉研究领域最经典的任务,近些年因为在医学成像精确分类、商品图片自动识别和色情暴力内容有效鉴别等现实应用场景中具有重要应用价值而受到广泛关注。伴随着大数据时代的到来,深度神经网络在图片分类任务中取得了优异的成绩。然而,在当前主流深度神经网络训练中,所有的样本处理都是平等的。实际上,由于在内容和标注质量方面的差异,图像必然有一定差别。因此,如何差异化处理图像是精确图像分类的关键。课程学习提出:在训练过程中,应该针对样本的难易,给予不一样的训练优先级。总的来说,课程学习认为在训练的前期应当学习简单样本,以捕捉样本总体分布和学习通用特征;在训练的后期应当学习困难样本,以对决策边界进行精细微调。具体实现不同任务的课程学习有两个关键问题需要解决:第一、如何衡量样本的难易,以及如何找到所谓的困难样本和简单样本;第二、是如何实现所谓的课程,也就是如何设计不同样本的优先级。针对这两个问题,本文结合图像分类的任务特点,将课程学习的思路引入图像分类任务中,主要内容包括:在第二章中,本工作提出了更加精细化的样本难易评判标准并实现了更加平滑的课程。由于大多数相关工作都是使用样本的损失值来衡量其难易,这种方式导致无法判断样本与决策边界的相对位置,因此本文提出使用样本的预测概率来衡量其难易。为此,本文提出一个教师-学生训练框架。其中,教师网络和学生网络的训练目标都是对图像进行分类,且它们是同步训练的。在每次训练迭代中,先训练教师网络,再利用教师网络的预测概率判断每个样本的难易程度。根据评估出样本的难易,本方法对训练学生网络的样本实施课程调整。过去的很多课程学习方法都是直接抛弃某些样本,这样会浪费大量数据。本文提出通过给训练样本加权的方式实现课程。这种方式让学生网络在训练的前期更加注重简单样本,后期专注于困难样本。我们在多个数据集中验证了所提出的方法的有效性。在第三章中,本研究工作提出了生成位于边界的困难样本,并利用其微调决策边界的框架。我们认为分布在决策边界的容易让分类器迷惑的样本可以帮助分类器学习到更加精细的决策边界。因此,本文首先使用生成对抗式网络产生了大量让分类器混淆的边界样本,再使用协同蒸馏学习技术让多个训练网络对易混淆样本达成一致分类,从而提高分类器对困难样本的分类能力,进而调整决策边界。本工作通过多个数据集上的大量实验,证明了所提方法的有效性。最后,本文又分析了上述两个方法的异同点以及各自的优缺点。
其他文献
本篇论文试对’85美术运动时期的美术批评进行研究,以20世纪文艺整体观和中国第二次现代美术运动的启蒙为背景,试图探讨’85美术批评在中国美术现代性转型中所起到的建构作用,以此时期对西方艺术各类观念的借鉴与学习从个案角度进行分析。论文主要采用文献检索、批评家个案研究与理论探讨相结合的方法从发展的视角阐述’85美术批评现象。以中西方现代发展为参照,探讨’85美术批评中对西方理论的借鉴与模仿所产生的本土
学位
执行和解协议是否具有可诉性是一个老生常谈的问题,关于该问题在理论和司法实务界也一直存在争议。究其根本,第一是关于执行和解协议的性质没有形成统一的共识,无法为执行和
升力式再入飞行器是未来航空航天领域发展的一个重要方向。升力式飞行器再入过程中,速度高、航程远,需要承受的热、以及动压等约束较大,因此,对再入轨迹与制导方法提出了较高的要求,本文以升力式再入飞行器为研究对象,主要解决升力式飞行器再入在线轨迹规划与制导的关键技术难题。升力式飞行器再入过程的运动学模型以及相关约束的选择是再入轨迹规划与制导的基础。本文推导了升力式飞行器三自由度再入运动模型,对状态归一化后
机器视觉系统由硬件部分和软件部分构成,硬件主要包括工业相机、光源、光学镜头和图像采集系统。其中光学镜头的成像质量影响着最终获取图像的清晰度和分辨率。本文通过学习
高压扭转(HPT)是一种成功、有效的剧烈塑性变形(SPD)的方法,该工艺主要是利用施加高压和扭转产生剪切应变来细化材料的晶粒,使晶粒的尺寸减小至亚微米甚至是纳米级,从而提高了材料的物理性能和力学性能等。但高压扭转所制得样品的组织性能和厚度容易在径向及轴向上分布不均匀。本文在传统单向高压扭转工艺的基础上,提出反复高压扭转工艺,采用有限元模拟对该工艺进行仿真,并与单向高压扭转工艺进行对比分析,验证了反
增强现实(AR)是通过把计算机生成的虚拟信息利用视频显示设备无缝融入到用户观察看到的真实场景中,来丰富和提升人们视觉体验的技术,是人机交互方向产生出的一种新的重要方式。近些年其在科技博物馆、多媒体课堂等教学场合得到了广泛的应用,但大多数都是通过使用手持标识方式的AR技术来进行交互的,其限制性较强,普遍存在易用性与沉浸感差的缺点。因此,利用人来代替手持标识作为AR的输入将是未来人机交互的发展方向,尤
非负张量分解是非负矩阵分解的多线性扩展。它继承了非负矩阵分解“整体感知基于部分感知”的思想,能在非负张量数据中挖掘各个维度的潜在信息,更高效地进行降维及特征提取,
随着“互联网+”在交通运输行业的深入发展,网约车、定制公交、城际拼车、共享单车、共享汽车、交通新型支付等新业态不断进入出行领域,促使乘客使用交通的方式发生变化,即出
轨道几何不平顺检测系统进行轨道检测时,因车轮空转与打滑、检测速度、是否通过曲线、轨道表面清洁状况、钢轨磨损程度等复杂检测环境的影响,轨道检测数据不可避免产生里程偏差,导致波形错位,造成数据应用困难。因此,针对轨道检测数据存在里程偏差的问题,深入开展里程偏差修正研究,就成为一个重要的研究问题。为了实现里程偏差修正,里程偏差识别与修正就成为关键所在。以波形相似性作为切入点,利用不同通道数据使用相同里程
机车关键部位,存在许多细小部件,例如机车车底轴承盖上的螺栓。人工检查易疲劳且很难准确记录所有部件的正常状态和形式,容易发生漏检、错检造成严重后果。近年来,在铁路应用方面,基于二维图像的缺陷自动检测系统已经趋向成熟,但仍然存在一些无法逾越的问题,二维平面的检测更加依赖于设备本身的精确度,零件表面油污灰尘易造成遮挡。三维获取数据不仅可以记录物体表面的形态,几何特征,还可以获取空间坐标等信息,将其应用于