基于自监督学习的表面缺陷检测算法研究与应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tiantian200510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表面缺陷检测是指对物体图像中的表面缺陷进行检测与定位,能够辅助剔除工业生产过程中的残次品,对于工业产品质量监控有着至关重要的作用。表面缺陷检测算法通常需要在无任何缺陷先验信息的情况下,对真实世界中的缺陷样本进行检测,但这会导致算法在缺陷区域的重建误差小,对缺陷区域定位效果差以及在实际应用中由于模型参数量庞大检测速度慢等问题。为解决以上问题,本文提出基于自监督学习范式的基于缺陷修正的表面缺陷检测算法和基于低层原型在线学习的表面缺陷检测算法,并设计了一种拉链缺陷检测应用系统,实现对拉链表面缺陷的实时检测。本文主要创新点及研究内容如下:1.提出一种基于缺陷修正的表面缺陷检测算法。当前基于重建的表面缺陷检测算法假设自编码器不能重建出在训练过程中从未出现过的缺陷区域。但由于自编码器的泛化能力过强,在检测过程中也能够完成对缺陷区域的重建,导致缺陷区域与正常区域的重建误差接近,无法实现对缺陷的检测。针对此问题,首先利用超像素分割算法分割正常图像获取超像素,并随机选取超像素添加高斯噪声以合成缺陷图像。然后利用掩膜自编码器对缺陷图像中的缺陷进行预测,由于掩膜自编码器在训练过程中输出的软掩膜图存在错误预测信息,可通过软掩膜图的错误信息模拟真实缺陷的异常激凸特性,因此将软掩膜图与缺陷图像相融合进一步模拟真实缺陷。最后通过缩小缺陷重建区域多个尺度特征与正常区域特征之间的曼哈顿距离而扩大与缺陷区域特征之间的曼哈顿距离,重建自编码器将缺陷区域修正为正常区域,提高缺陷区域的重建误差。实验表明,本算法相较于以往算法有着更好的缺陷检测效果。2.提出一种基于低层原型在线学习的表面缺陷检测算法。当今算法先对规则的图像区域进行缺陷检测,再将区域检测结果分配给区域内像素,但由于规则图像区域可能即包含正常像素,也包含异常像素,区域检测结果并不能代表区域内每一像素的检测结果,缺陷区域内像素的检测结果不准确,导致对缺陷区域的定位效果差。针对此问题,首先提取图像的等尺寸低层细节特征矩阵。然后,在训练集数据的所有低层细节特征上进行在线聚类学习获取低层原型向量。最后将与低层细节特征欧式距离最小的原型向量作为伪标签,对特征矩阵提取网络进行训练。检测时,逐一计算特征矩阵中的低层特征与原型向量之间的度量距离,获取特征对应位置像素的异常得分,直接对像素是否为异常进行决策。实验表明,该算法相较于以往算法对缺陷的定位更加精确。3.设计一种基于轻量级检测模型的拉链表面缺陷检测应用系统。在实际应用中缺陷检测模型参数量庞大,导致模型检测速度慢。针对此问题,首先根据拉链数据本身的特点,设计了拉链图像的数据采集与预处理步骤。接着,提出了适合于拉链的表面缺陷检测流程。最后,基于自适应超球体对轻量级的深度支持向量数据描述模型进行改进,至此构建出了用于拉链缺陷检测的应用系统并将该系统进行部署。在拉链生产加工的工业场景中,该系统能够完成对缺陷拉链实时精准的检测。
其他文献
目标跟踪始终是科学研究中的热点领域,随着社会的不断发展,跟踪场景变得日益复杂,多目标跟踪技术也随之得到快速的发展和应用。群目标跟踪的概念随之被提出,群目标跟踪中跟踪的目标是由多个单目标组成,它们以相同的速度或方向进行移动,如无人机群,舰艇编队等。目前群目标跟踪更是被广泛的应用在各个领域,例如智能监测、机器人视觉导航,室内定位等,随着研究的深入,越来越多基于随机集(RFS)的滤波算法涌现出来,例如概
学位
报纸
在医学图像领域,图像融合是一种重要的医学辅助技术,可以综合处理不同医学成像设备提供的图像信息,并进行有效组合,获得一幅信息更加丰富的结果图像。本文研究了基于反卷积神经网络及直觉模糊推理的CT/MRI医学图像融合算法,具体研究内容如下:研究了基于多方向梯度的直觉模糊推理CT/MRI图像融合算法。为了获得能够充分表征源图像的特征图,本文采用基于高斯方向滤波器的反卷积神经网络,根据待融合数据,设计了图像
学位
高校实验教学是学生掌握专业技能与培养解决实际问题能力的重要途径,其中,学生实验课堂表现是实验成绩评估的重要环节。但是,近年来随着学生数量的增加与实验内容复杂度的提升,单纯依靠教师已难以及时、精确地评估学生的课堂表现。因而有必要将人工智能技术融入到实验课堂教学中,通过智能视频检测方法实时识别学生的实验课堂行为,提高了课堂表现评估的精确性和实时性。本课题充分考虑大学实验课堂的具体情况和需要,为解决学生
学位
同步定位建图技术(Simultaneous Localization and Mapping,SLAM)是在未知区域中实时获取自身定位和环境位置信息的技术。目前,单目SLAM存在建图稀疏的问题和运动较快时容易发生定位丢失的问题。针对这些问题,本文对基于特征点法的单目ORB-SLAM2系统进行改进,提升了系统建图的稠密程度和部分快速运动场景下的鲁棒性。本文工作如下:(1)针对单目ORB-SLAM2系
学位
在驾驶员疲劳检测、教育和人机交互等应用领域,理解人类情绪的状态或者目的是必要的。由此,研究者向人脸表情识别投入了更多的关注。大量研究已经证明了对于解决识别任务,基于卷积神经网络方法是强大且成熟。但是,当我们把上述理论应用于多姿态人脸表情识别任务时,依然会存在很多问题。事实上,不同姿态下人脸重要的局部区域会有所不同,而现有深度学习框架中的注意力机制对这些局部区域的鉴别性信息的关注度不足;另外,人脸表
学位
近年来,各式成像设备的迅猛发展使得人们能够获取多种异源图像,将其整合并利用的前景越发广阔。图像配准技术是将异源图像拼接、融合等视觉任务提高精度的瓶颈和必要前提,也是图像处理领域的研究热点。可见光与红外光图像作为异源图像中的两种经典多模态图像,因其所处光谱的不同波段及信息互补性,其图像配准任务可以充分利用互补信息,减少场景目标的不确定性,提高后续图像分析的精度。然而,基于传统手工特征的配准方法往往对
学位
在传统舌诊的过程中,诊断结果容易受到医师经验的影响,并且还存在着交叉感染的风险。为此,本文设计了一种基于FPGA的智能舌诊系统,该系统将传统舌诊与现代图像处理技术相结合,通过摄像头采集舌体图像,并由FPGA上实现的算法处理模块对舌体的颜色特征以及性状特征进行识别,并将诊断结果显示在显示屏上。凭借着FPGA高度并行化运算的优势,大大提高了系统的运行速度,并且该系统能耗更低、体积更小,更加便于系统的部
学位
随着卷积神经网络的发展,深度学习方法被广泛应用于医学影像分析和处理任务中。这些深度模型往往具有庞大的参数规模,普通医院与诊所难以配备相匹配的高性能显卡,使得在学术界中性能优异的深度学习模型难以部署到医院的设备上,无法为医生提供实时高效的辅助诊断结果。因此,如何在保证模型性能的前提下尽可能压缩模型,成为近些年深度学习领域关注的热点问题。结构化剪枝作为一种主流的模型压缩方法,因其压缩得到的模型有结构稀
学位
随着国民经济的不断增长,中国机动车保有量逐年提升。交通参与车辆的增多,导致交通事故频发、交通拥堵率提高,带来了环境污染、能源浪费等诸多问题。为解决此类问题,智能交通网联化的研究成为了近几年来的研究热点。实现智能汽车网联化的主要方式,是车载嵌入式固件通过自身通讯模组与平台或其他车辆进行通信,通讯模组可以通过4/5G或V2X等通信手段实现与外界的交互。V2X作为车辆间专用的短程快速通信手段,其效率与可
学位