基于半监督学习的带钢表面缺陷分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yaocjs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钢铁产业是我国的重要基础产业,而带钢正是其中重要的中间材料,带钢加工过程中的表面缺陷检测技术始终是研究的热点。传统的计算机视觉结合深度学习的带钢表面缺陷分类方法,在监督学习下往往关注边缘检测算法和分类网络的改进。带钢表面缺陷分类任务存在着数据集样本量较少、样本标签标注困难的特点,限制着传统监督学习下分类模型的性能提升。半监督学习(Semi-supervised Learning,SSL)可以同时利用有标签和无标签样本进行深度学习下分类模型的训练,从而减少训练数据集样本的标签标注工作。为了将半监督学习思想引入到带钢表面缺陷分类系统中,解决制约传统监督学习性能的样本标注困难等问题,基于Resnet18的半监督学习带钢表面缺陷分类系统结合半监督学习的伪标签思想,使得原本需要在监督学习下训练的分类模型可通过有标签样本和无标签样本混合的数据集进行训练,实现半监督学习,减少带钢表面缺陷分类任务中初始数据集的标签标注工作。基于DCGAN和Resnet18的半监督学习带钢表面缺陷分类系统引入了对抗生成网络(Generative Adversarial Networks,GAN)进行无标签样本的生成,为分类模型的训练提供更多的样本支持。除此之外,在半监督学习下,为了使GAN和分类网络有效结合,系统采用了新的投票机制,使得GAN生成的样本可以先贴上一个合适的伪标签,再被分类网络进行学习。在数据增强的思想下,半监督学习能提升系统在带钢表面缺陷初始样本量有限情况下的分类精度,并使系统有更好的鲁棒性和泛化性。实验表明,基于Resnet18的半监督学习系统可以在约2%的分类精度损失下,减少75%标签标注的工作量;而基于DCGAN和Resnet18的半监督学习系统可以在合适的样本扩充倍数下,为系统的分类模型提升约2%的最高分类精度,取得较好效果。
其他文献
COStream是一门高效的数据流编程语言,通过将通信与计算分离凸显出程序的高并行性,从而充分利用多核平台的性能。但在任务划分方面,COStream现有划分算法不具有普适性,划分各个阶段的界限模糊不清;在数据传输方面,编译器底层的缓冲区设计不够系统化,且COStream作为支持并行编程的语言,其线程同步机制也存在优化的空间。针对现有COStream任务划分存在的问题,将任务划分细分为两个阶段进行优
学位
光缆是一种电信线,在架设光缆时,如果架设的光缆与原本已经架设好的电线发生交越或搭挂,这种电信线与电力线发生交越或搭挂的场景被称为三线交越。在这种场景下,即便光缆与电力线没有直接接触,但二者可能发生耦合感应,影响光缆的寿命,也可能引起强电入侵,对人身安全产生威胁。由于上述原因,发生交越的光缆部分必须加装保护套。目前,检验光缆架设规范主要由人工完成,导致检察员工作量大。从人工施工采集获得的图像中自动检
学位
构建高质量的、大规模的数据集是机器学习取得良好效果的前提和动力。数据集的构建通常由研究人员根据实验需求进行手工标注,然而由于手工标注工作量较大、工作内容枯燥无味,往往导致标注成本过高、标注效率低下。随着机器学习领域的发展,如何提升标注效率成为亟待解决的问题。为了提升标注效率,设计并实现了一个半自动视频图像标注系统,支持对视频图像数据进行手工标注,支持调用各类视频图像处理算法预测标注结果、人工对预测
学位
通用目标检测卷积神经网络算法精度不断提升,随之而来的是计算量与参数量的爆发式增长。与之相反的是,新兴的智能交通、自动驾驶与智能安防等领域都使用嵌入式AI设备,这给卷积神经网络算法提出了新的挑战。对高性能目标检测网络进行深层次的压缩,让网络参数量大幅度降低,这在计算资源匮乏的嵌入式AI设备上部署目标检测卷积神经网络是至关重要的。昇腾NPU使用定制的达芬奇架构,如何实现快速卷积计算过程,充分发挥昇腾N
学位
目前大量的恶意软件和良性软件都通过加壳来保护自己。有数据显示,从网上下载的恶意软件中,有58%都是加壳程序,这58%的加壳程序中又有35%使用了自定义壳,因此研究一种更好的自动化脱壳方法变得越来越有必要。本文设计并实现了PyREUnpacker,一种基于动态分析的PE(Portable Executable,可移植的可执行文件)文件自动化脱壳系统。通过将样本置于虚拟机中运行,PyREUnpacke
学位
随着物联网时代的来临,准确的手势识别技术已经成为人机交互领域中众多新兴应用的基石。现有的手势识别系统主要基于相机和可穿戴设备,它们分别受限于光照条件与用户的积极配合。近些年,许多研究已经提出了一些基于无线信道状态信息(Channel State Information,CSI)的手势识别系统,在无需与用户接触的情况下实现非视距的手势识别。但是这些方法容易受到环境变动的影响,应用于新环境时都需要繁琐
学位
随着计算机和遥感技术的不断发展,人们采集、存储遥感影像数据的能力得到了很大的提升,同时基于深度学习的目标检测任务也逐渐应用于遥感影像中。使用深度学习的方法训练检测器需要大量有标签数据驱动才能获得很好的检测效果,而现实中存在海量无标签数据,所以使用这些无标签数据来辅助优化检测器具有很大的研究意义。首先,本课题分析传统基于自训练的半监督学习方法理论,依据相似性聚簇原理假设,将EM算法思想应用于半监督学
学位
近年来,随着物联网技术的迅速发展,时间序列数据量出现了迸发式的增幅。股市行情的预测,天气变化的预测,金融分析,人口预测等等,都离不开海量时间序列数据的支持。索引与可视化成为分析这些时间序列数据的先决条件,但是时间序列数据实时产生,数据量动辄达到百万、千万甚至亿万级别,如何完成这样数据量的时间序列数据的存储、索引以及可视化充满了挑战。为了有效利用数据存储空间,时间序列数据存储采用分布式压缩存储结构,
学位
随着人们对室内定位服务的需求日益增加,如何为用户提供简单、高效、精确的室内定位服务成为研究热点。大部分相关研究的关注点在于单独的室内定位方法的研究,室内位置服务在实际应用中还需为用户提供地图显示、路径规划、定位、导航、楼层切换等配套服务。针对以上问题,以某大学办公实验楼为研究对象,以室内定位导航系统的功能设计与实现方案的选择为研究重点,实现了室内定位导航系统。在设计了室内地图数据结构的基础上,对办
学位
随着人工智能技术和物联网技术的发展,无人驾驶和车路协同技术得到了长足的发展。同时,可持续发展在社会进步中受到越来越多的关注,公共交通、步行、骑车等绿色出行方式受到鼓励,非机动车在道路上的行驶安全需要保障。基于深度学习的非机动车检测系统能够在道路的机动车流中检测到非机动车,通过车路协同系统同机动车共享检测结果,提高道路的安全性。目前的道路监控系统主要针对机动车,非机动车的数据量小且非机动车目标也较小
学位