主动学习在图像分类问题上的研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:z58119366
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉作为人工智能的主要方向之一,其目的是使得电脑能够自动的识别出图片里的物体,让机器具识别物体的能力。近年来随着大数据和计算机运算能力突破性的发展,加上研究人员对深度卷积网络的不断研究,计算机视觉已经在很多领域中取得了成功,如人脸识别、智慧城市、图片搜索等等。然而,目前的计算机视觉技术仍然是以有监督学习的模式为基础,即需要大量的高质量标注样本来对模型进行训练。但是在大部分实际应用场景中,获取未标注的样本比较容易,想要高质量的标注这些样本则需要花费很大的人工成本,那么研究如何减少需要标注的样本数量就显得比较重要。主动学习通过制定的策略,在未标注的样本中主动筛选出能够有效提升模型性能的样本,通过迭代选择,在保证模型精度的情况下尽可能少的选择出有效样本并对其进行标注,从而减少需要标注的样本数量。主动学习可以通过有效样本的选取来减少样本标注的工作量,因此对于主动学习的研究是一项具有实际意义的工作。本文主要研究主动学习在图片分类任务上的应用,主要工作如下:(1)本文首先介绍了课题的背景及意义我们对近,并对近年来主动学习算法进行了广泛的调研,对其进行了系统的分类并围绕“基于不确定性的主动学习算法”、“基于生成模型的主动学习算法”和“针对卷积神经网络设计的主动学习算法”三个类别进行了讨论,详细的介绍了每种类别的代表性算法,并同时系统的介绍了深度度量学习中的一些思想。(2)本文结合自步学习的思想,提出了基于自步学习的主动学习算法,将主动学习迭代选择的步骤看作自步学习的过程,将样本的选择顺序按照学习困难程度由简至难的进行选择,即在算法初期选择那些分类置信度较高的样本,后期选择不易分类的样本,这样更加利于模型的收敛和避免过拟合。同时通过聚类方法来控制困难样本的数量并且针对主动学习设计了一个损失函数来提升模型的效果,在使用预训练模型的情况下可以节约标注成本60%左右。(3)本文结合深度度量学习,提出了一个基于中心点度量学习的主动学习算法。该算法在训练过程中着重发掘样本在特征空间上对模型的贡献度,提出了一个中心点分离的度量学习损失函数。在通过已标记数据训练出来的特征空间上,根据样本到中心点之间的距离来进行样本选择。同时在训练时对不同样本施加不同的权重使其着重优化困难样本,并使用Core-set方法来解决选择样本间的信息冗余问题。该算法简单易用,可以直接嵌入到任何现有的训练过程当中,同时实验也证明了可以减少标注成本50%以上。
其他文献
移动互联网及通信技术的发展带来了智能手机用户的爆炸式增长,人们习惯于使用智能手机上丰富的应用来方便自己的日常生活。然而智能手机在给人们的带来便利的同时,也带来了更大的隐私泄露和财产损失的风险。目前,智能手机上主要是通过配备一次性的身份认证机制来保证设备的安全,例如数字密码、指纹识别、面部识别等,但是这些机制具有安全性和易用性方面的不足。在安全性方面,一次性身份认证机制仅在用户获取设备访问权限时生效
学位
电网故障处置预案是调度人员电网故障处置经验的总结,是电网调度人员处理故障的参考手册。过去,为提高查阅效率,使用计算机存储和管理预案文本,并采用基于规则的模板库匹配方法辅助查找,这种方法存在实用性不强、处理方案维护困难、故障判定效率低等不足。因此本文开展基于深度学习的电网故障处置预案文本挖掘研究,利用自动化手段理解和分析预案中故障后电网运行方式和处置要点,挖掘故障后方式与处置要点之间的关联关系,使得
学位
RNA序列在生命的各种过程中扮演着非常重要的作用,其功能常常与其二级结构或者三级结构密切相关。本文主要基于并行化的蚁群算法研究了RNA一级序列到RNA二级序列的转变过程,同时为了对算法进行提速,研究了并行化对算法的影响。本论文的主要工作如下:(1)以串行算法为基础,提出并实现一种基于Open MP的多线程的并行蚁群算法。算法使用Mathew&Turner能量参数,通过局部优化的方法测算RNA不同结
学位
大数据处理模式下,数据密集型系统强调为用户提供可靠和高效的存储和计算服务。随着数据量的增长,数据处理框架完成了由计算为中心到以数据为中心的转变。为了提高数据中心的性能,当前大数据处理系统Hadoop使用非易失性存储器NVM(Non Volatile Memory)作为数据的存储载体。由于NVM存在耐写性差的特点,在进行大数据处理时NVM极易损坏,进一步导致系统中的存储数据丢失。本文从最小化数据丢失
学位
<正>开学季是开展中小学生交通安全宣传教育的关键节点之一,为充分用好这一关键时段,一直以来,公安部交通管理局高度重视,部署各地全力做好开学季各项工作的同时,积极打造交通安全宣传“开学第一课”品牌。各地各级公安交通管理部门、教育行政部门、学校、新闻媒体等单位积极参与,形成合力,共同开展“开学第一课”主题宣传教育活动,取得了良好效果。
期刊
随着人口老年化的逐步加剧,牙齿的保留时间逐渐延长。口腔内科疾病发病率的上升使得牙疾病的诊断和治疗成为一个不容忽视的全国性问题。牙隐裂(Cracked Tooth)是一种常见的牙齿疾病,但是一些在牙体内部和牙体根部的裂纹,无法被直接观察,因此需要借助放射影像进行诊断。锥形束CT(Cone Beam Computed Tomography,CBCT)是牙放射影像中最先进的设备。能够识别牙体内部微小的裂
学位
需求响应作为智能电网技术的重要组成部分,是缓解电网供需平衡矛盾的手段之一,国内外研究者对此开展了大量研究和项目实践,以进一步挖掘需求响应技术的潜力。近年来,研究群体行为的同伴效应理论引起了各领域学者的广泛关注,研究人员利用个体间的相互影响设计机制引导个体行为以获得整个群体的效果优化,为我们提升需求响应性能的工作目标提供了新的思路。本文将同伴效应的理论应用于智能电网中的需求响应机制设计,主要的研究工
学位
<正>《义务教育语文课程标准(2022年版)》提出:“以促进学生核心素养发展为目的,以识字与写字、阅读与鉴赏、表达与交流、梳理与探究等语文实践活动为主线,综合构建素养型课程目标体系。”语文指向核心素养培育的单元整体教学需要教师深挖文本,做好单元内课文“1+X”的整合,将核心素养的培育反复落实到多次的课文整合教学中。由此,学生才能提高语言文字运用能力和思维品质,在大量的审美感知中发展审美能力,涵养文
期刊
在基于可穿戴传感器的人类活动识别实际应用中,设备的位置、朝向是多样且不确定的。在人类活动识别领域内缺乏拥有足够丰富变化的数据集,这对由数据驱动的深度学习模型的泛化能力提出了很大的挑战。提高模型的鲁棒性、使模型能够快速适应环境条件变化的方法,具有很高的研究价值。本文主要研究内容包括以下方面。缺乏足够丰富的人类活动数据集会导致训练出的模型存在过拟合、泛化能力弱的问题。mixup方法是一种新颖的正则化方
学位
跨模态检索是指给定一种模态(如图像)的查询项,在另一种模态(如文本)下检索其相关项的技术,近年来已成为多媒体、多模态领域的研究热点。由于不同模态数据具有不同的分布和表示,异构数据之间的相似性难以有效度量。深度学习可以被视为一种多层非线性映射函数,具有比传统浅层映射方法更好的非线性映射能力,在目标检测、对象识别等多个领域取得了出色的成果。本文采用基于深度学习的方法,将来自不同模态的数据映射到公共子空
学位