基于深度学习的含噪声标签图像的分类研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:enlic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,图像分类技术在日常生活中逐渐扮演着重要的角色,是人脸识别、目标定位、医疗诊断等领域的核心技术。然而之前进行图像分类研究时所依赖的数据全部是经过人工手动标记,这种方式不仅成本昂贵,而且耗时耗力,因而大大限制了图像分类能够发挥的潜力,因此如何在低成本的数据上训练出高精度、高鲁棒性的模型十分重要。互联网上每天都会产生海量图像数据,这些数据的获取方式简单、多样性强,往往还包含额外的语义元数据,但由于用户等因素不可避免的会包括含噪声标签的图像,因而本论文旨在研究对含噪声标签图像的分类,主要研究工作分为如下三个部分。(一)对原始数据集进行“数据提纯”,过滤出“简单”、“干净”的代表性小样本。首先设计出“正负”词-级类别特征,将原始文本进行分词并表示为词向量,然后使用我们设计的混合距离相似度算法计算词向量之间的相似度,进而匹配过滤出“干净”的baseline数据集,并训练出baseline模型。(二)针对数据集设计出由简单到复杂的“课程学习”策略。使用baseline模型抽取特征,进行概率预测、PCA降维、t-SNE可视化、层级聚类分析后重新划分数据集,形成各种原始数据的子集,使用Inception-v3、Resnet-50架构迭代的进行训练,并得出最终的模型。(三)在wv-40数据集上进行实验并进行对比分析,结果显示在经过“去噪”后的最终数据集上训练的Q10denos模型在测试集的准确率比原始含噪声标签的数据集上训练的Target模型高5.9%,从而证明了本论文算法能够学习到更好的表示且鲁棒性更好;比没有经过聚类重划分的Q10模型高2.35%,从而验证了聚类划分能够提升模型的准确率;比先在原始Target数据集上训练,然后使用baseline数据集进行微调得到的TFBL模型高5%,说明了本论文的算法优于前人的方法;同时为了直观的分析Q10denos模型的特征表达能力,本论文使用引导性后向传播对tench、bulbul、terrapin等图片进行可视化,结果表明模型很好的学习出物体的轮廓,综上都说明本论文所提出的算法对于含噪声标签图像的分类十分有效,尤其对于噪声数据比例较大时效果更为明显。
其他文献
基于协同过滤的推荐系统是解决信息过载问题的一种很好的方案,而且能够提供一对一的个性化服务。但是基于协同过滤的推荐算法同样也而临着一系列的瓶颈问题,如数据稀疏性问题,可
多时相遥感影像变化检测是遥感技术的一个重要应用领域,它是利用不同时期遥感图像的差异检测出该地区的地物变化信息,可用于环境监测、防灾减灾和战场态势分析等。遥感影像的变
面向服务架构(SOA,Service-Oriented Architecture)是新一代的企业系统架构思想。面向服务架构以服务的方式来公布企业业务流程,供内部系统的其他部分和业务伙伴调用,并采用
现如今,互联网技术逐步深入到人们生活中的各个方面,与人们生活息息相关的网购行为也在网络巨头的推动下呈现出愈发强劲的趋势,其中移动端购物在网购行为中已经成为主要部分
图像分割在图像处理,图像分析,计算机视觉和模式识别等方面都是一项基础的、核心的技术。图像分割结果的好坏直接影响到这些后续高层的处理结果。阈值分割方法是最经典的图像分
OCS,Online Charging System,在线/实时计费系统,是由3GPP在TS 32.296中提出的具有开放性和通用性的实时计费系统通用参考框架,支持基于承载、会话和内容事件的统一计费。这
随着计算机网络资源相关应用重要性的快速增长,威胁这些应用的入侵行为成了一个亟待解决的关键问题。入侵检测技术是继防火墙、数据加密等传统安全保护措施后新一代的安全保
缓冲区溢出攻击是一种严重威胁网络安全与系统安全的攻击方式。由于存在缓冲区溢出漏洞的应用程序不计其数,对缓冲区溢出攻击防范技术的研究具有重要意义。 StackGuard是基
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程
随着互联网的日趋成熟,Web应用程序由于提供了丰富的用户界面和其良好的可维护性而变得越来越流行。但是,传统的Web应用程序面临着许多问题,例如较低的性能和较高的网络流量