论文部分内容阅读
目前基于深度学习的语义分割技术发展迅速,在自动驾驶、虚拟现实、增强现实等领域有广泛的应用前景。现阶段大多数语义分割网络以提高精度为目标,需要大量的浮点运算和冗长的运行时间。另一些实时语义分割网络主要以折损空间信息为手段加快推断速度,这将导致精度退化。为了获得更高精度与速度的语义分割网络,本文研发了空洞卷积差分网络(Atrous Convolution Difference Network,ACDNet),包含上下文支路与空间支路。以ResNet-18为骨干网络的上下文支路中,设计了空洞差分模块(Atrous Difference Module,ADM),将目标局部特征与环境上下文特征进行差分,借由注意力机制获取全局上下文信息,并选择有效的特征通道。空间支路中连续堆叠小步长卷积,用以编码丰富的空间信息。特征选择模块(Feature Selection Module,FSM)将两条支路的特征进行合理融合,避免了直接串联不同类型特征导致的精度下降。ACDNet在CamVid数据集上(960×720分辨率),使用GTX 1080Ti进行前向推断,平均交并比(Mean Intersection over Union,mIoU)可达到67.7%,速度可达到81FPS。对于1920× 1080分辨率的输入图像,ACDNet前向推断仅消耗 31.3ms。本文基于ACDNet研发了 USB接口缺陷检测算法,运行在以NVIDIATegra X1为处理器的嵌入式系统。首先将ACDNet进行适配以提升小目标的分割能力,在USB分割数据集上可达到95.9%的mIoU。并对Faster R-CNN目标检测算法做出三点改进,包括增加锚点种类、加入多尺度ROI Pooling、使用特征金字塔网络作为骨干网络。改进的Faster R-CNN算法对分割的表面区域进行检测,可精准快速地检测凹点、划痕和脏污等缺陷。经过测试,本文研究的USB接口缺陷检测算法检测精确率达96.23%,漏检率仅为1.29%,具有较高的工程应用价值。