基于深度学习的图像单类分类算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:isongnosi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类旨在判断输入图像所属类别,是计算机视觉四大基本任务之一,单分类(one-class classification)是针对数据集中只包含一种类别样本的分类问题,在实际场景中的应用十分广泛。近年来随着深度学习理论的发展,许多优秀的分类网络被提出用来解决单类分类问题。但在实际应用中,分类器的分类效果常常会受到复杂背景、数据样本集小、目标在图像中的占比小等诸多因素影响,效果还不是很理想,基于深度学习的单分类网络的分类性能还有一定的进步空间。本文围绕上述问题进行了深入研究,主要研究内容和成果包括:(1)构建了一种基于显著性检测的ALOCC(Adversarially Learned One-Class Classifier)单分类算法。对初始图像数据集进行显著性检测操作,处理后的图像将非目标主体的背景或物体过滤掉,只保留有待分类的目标主体,增强了目标显著性,消除了背景特征对分类准确率所产生的干扰现象。实验结果表明,在不改变ALOCC原算法网络结构的基础上,使用本文提出的基于显著性检测的图像单分类算法,分类结果得到了一定程度的提高,在公开数据集Caltech-101、Caltech-256上进行验证,和原ALOCC算法的实验结果相比,AUC、F1分数数值都有了一定程度的提高。(2)构建了一种基于双对抗网络的ALOCC单分类算法。在原有的ALOCC网络结构的基础上,结合AAE(Adversarial Auto Encoders)网络,形成一个包含两个对抗机制的网络结构进行训练,使得算法对训练数据集中特征的提取更合理准确。在原网络中损失函数的基础上添加了编码向量和给定向量的均方差损失,改善了算法在处理不同样本时权重不平衡的问题。使用本文构建的图像单分类算法在公开数据集MNIST、Fashion-MNIST和Caltech-256上进行验证,与原ALOCC算法的结果进行对比,分类效果有了明显的提升。与近几年的单分类算法相比,综合性能有了一定的提高。
其他文献
能源在我国的发展中不可或缺,它为我国的经济和社会发展提供了重要的保障。能源供需系统是针对两地区的能源需求与能源供给之间关系进行的研究,能源系统的研究能够为能源的发展提供一定的理论基础。由于能源系统的复杂性,因此需要施加一定的控制使得系统的稳定性达到所需要的目标。本文针对已建立的能源供需系统模型,施加时滞反馈控制,并对系统进行动力学分析。本文的研究内容主要由以下两部分构成:第一部分针对两地区的能源需
随着健康理念的不断发展,利用环境促进健康的需求不断增加。水资源是健康类场地的重要资源,而针对水体展开的健康效益研究仍有所欠缺。本研究进行了恢复性环境、视觉感知、自然度等研究的综述,从视觉感知角度探索不同类型水景图片自然度水平;以自然度评价为依据,研究不同等级水景图片对认知和情绪的影响;依据水景图片自然度评价、认知和情绪的影响结果,从不同自然度等级水景图片的景观特点及不同自然度等级水景的健康优势特性
呼吸运动是呼吸肌的一种节律性活动,也是整个呼吸过程的基础。Pre-B?tzinger复合体是呼吸节律产生的关键部位。不同的外激励作用会对呼吸节律产生不同的影响,甚至产生病理性呼吸节律。因此了解参数激励调控下的节律模式及其转迁规律有着十分重要的意义。本文以改进的单个pre-B?tzinger复合体中兴奋性神经元模型为研究对象,从动力学角度研究外部刺激电流和磁流对呼吸系统复杂放电模式的影响。本文内容共
随着社会经济的快速发展和城市化进程的加快,城市机动车保有量呈现飞速增长趋势,导致道路网络的交通负荷日益增大,给人们的日常生活带来严重的影响,如日常出行频繁遭遇拥堵、空气质量下降、居民的出行成本增加等。城市交通信号控制和交通流分配是两类应对交通拥堵问题常用的手段。交通控制和驾驶员路径选择协调运作可以有效降低出行延误时间,提升城市交通网络的通行效率。因而,对交通流分配和信号控制的组合优化研究具有十分重
由于行人再识别其未来应用前景十分广泛,近年来一直是计算机视觉领域的研究热点之一。随着深度学习技术的发展,计算机设备性能的提升,越来越多的研究者已将关注点由基于图片的行人再识别转到基于视频的行人再识别。但是,在视频行人再识别领域,除了传统的光照、遮挡、视角变换与背景变换等问题之外,该领域还有另外一个重要问题,即输入数据量由单张图片变为多张图片组成的视频序列所带来的计算量倍增。如何在降低计算量的同时有
臭氧是氧气的同素异形体,由三个氧原子构成,在常温下容易自行分解为氧气。同时臭氧具有极强的氧化性和杀菌能力,并且不产生二次污染,是一种优良的氧化剂和消毒剂。目前国内外学者对臭氧的理化特性和制备方法进行了深入地研究,取得了一系列成果,为臭氧的实际应用提供了坚实的理论基础。介质阻挡放电法(Dielectric Barrier Discharge)制备的臭氧产量大、浓度高,所以广泛应用于工业制备臭氧领域。
情绪识别是近年来人工智能的一个研究热点,也是一个难点。人的情绪会通过面部表情、语音、身体姿态等不同模态表达出来。目前,有关静态面部表情和语音的情绪分类研究比较多,但基于面部表情及头部姿态的多模态情绪识别研究相对较少。课题研究了面部表情和头部姿态这两种模态的情绪表达特征,利用宽度学习(Broad Learning System,BLS)算法建立了基于这两种模态特征的情绪识别模型,并在公开的情绪视频数
复合式VTOL无人机为最近比较火热的无人机机型,以其独特的四旋翼加固定翼的结构特点应用在诸多领域,复合式无人机结合了四旋翼和固定翼的特点,既可垂直起降,又可以进行平直飞行,大大减少了无人机对地形或者其它环境的依赖,其在最近几年得到快速的发展。由于复合式无人机近年来需求的增长,对复合式无人机的研究和制造就成了重中之重,直接利用一个实体无人机进行实验可以给我们最佳的反馈,但是由于极高的造价,导致我们不
下肢辅助运动装置是一种便携式可穿戴智能设备,它将人的下肢与机器结构巧妙的结合起来,能够为人体提供支持保护,同时也能够辅助人体完成步行等行为。按照功能的不同,可以分为:致力于解决下肢运动能力丧失或者严重损伤患者的运动问题的康复类型的辅助运动装置和增强人体负载能力的辅助运动设备。本课题围绕下肢辅助运动装置控制系统进行研究,主要做了以下工作:(1)通过研究有关人体下肢辅助机器人文献资料,总结了下肢辅助运
网络化控制系统是将控制器、执行器与传感器通过通信网络连接起来的一种分布式控制系统,具有远程和大范围控制、便于安装和维护、移动性强等优点。由于通信网络特别是无线网络的开放性和保护不足,通过网络传输的数据很容易被窃取,甚至遭到恶意攻击者的破坏。因此,本文从控制安全的角度研究了网络化控制系统中虚假数据注入攻击的设计、检测和分析问题,主要研究工作如下:(1)针对网络化控制系统反馈通道测量数据和前向通道控制