论文部分内容阅读
在工业生产环境中存在着一个普遍的现象,好样本的个数远多于负样本的个数,并且生产背景往往较为单一。通常来说,工业相机的分辨率超过千万甚至上亿像素,因此通过机器学习的方法将会消耗大量的运算资源。如果用降分辨率处理输入图像,将会导致小缺陷区域的丢失,因此精准高效的工业缺陷检测算法成为了一个极大的挑战。在深度学习之前,手工提取特征被普遍的使用于缺陷检测算法中,由于需要手动的去提取特征参数使得其实用性和泛化性大打折扣并。自然场景下的深度学习检测算法往往依赖于大量的训练样本,但由于工业缺陷检测中不存在大量的缺陷样本训练集,使得深度学习算法并不能完全发挥它真正的作用。为了解决小样本训练问题,本文加入了正样本的信息用于扩充样本探索空间。为了解决深度学习在小样本中容易出现过拟合的现象,本文引入了正样本参考信息,在使用样本增强方法的情况下,将输入的超平面的直线样本空间映射到超平面的圆域,从理论上来说扩充了小样本空间。除此之外,双端输入的孪生网络可以将正样本和负样本的空间差通过相似性热度图来表达。为了解决多尺度检测问题,特征图像金字塔被加入到网络中,通过在三个不同的尺度空间学习相似热度图分布,有效地解决了缺陷大小尺度分布严重不均衡问题。最后通过逻辑回归得到大致的候选框集合,并通过提出的Bbox-Affine算法将候选框的个数压缩到了个位数,这使得对第二阶段的精分割网络的负担有了了显著的减小。在细分割网络中,本文在Deeplabv3+的基础上,增加了多个不同的尺度通道,将注意力模块加入到了每一个融合层后,使得网络能够自发地去学习更好的权值分布。另外,考虑到工业场景对实时性的要求,本文采用了D2S和S2D的空间压缩方法对网络进行加速。考虑到表面缺陷检测的公共数据集的缺失,本文专门从工业场景中收集了1100张最具代表性的公用数据集,此数据集包含了在焊接场景、USB制作场景、工业器皿和LED生产场景下中普遍存在的缺陷类型。最终,经过与Mask R-CNN、ASDI、商用软件AIDI比较,证实本文提出的算法有着显著的效果。