论文部分内容阅读
近年来,随着计算机软硬件技术的发展,深度学习、卷积神经网络技术在计算机视觉领域掀起了一股浪潮。卷积神经网络的出现,使得图像中物体特征设计的难题得到了解决,越来越多的研究将卷积神经网络应用在计算机视觉领域。目标检测作为计算机视觉领域内的基础任务,一直是热门研究的课题。国内外学者提出了多种以卷积神经网络为基础的目标检测算法并加以改进,例如R-CNN,Fast R-CNN,Faster R-CNN,RFCN,Mask RCNN,Yolo系列,SSD等目标检测算法。单次多重目标检测器(Single Shot Multi Box Detector,SSD)是一种以深度卷积神经网络为基础的一步法检测器,其优点是检测速度快,且精度可达到与两步法检测器相当的程度。然而,SSD目标检测算法也依然存在着对小目标物体检测效果不好、特征提取方式单一、难以在普通机器上对目标进行实时检测等问题,这些问题限制了SSD目标检测算法的性能。因此,本文针对SSD目标检测算法中的不足之处,提出改进方案,本文主要工作内容如下:1.针对SSD目标检测算法的特征提取方式单一的问题,本文提出了一种基于多尺度卷积结构的SSD目标检测算法(SSD object detection algorithm based on multi-scale convolution structure,MSSD)进一步提升算法的检测精度。将不同大小卷积核并列排布构成多尺度卷积结构并加入SSD目标检测算法的检测层之中,丰富特征提取的多样性。在PASCAL VOC公开数据集上进行仿真实验,针对测试数据集,分析比较了原算法与提出的改进算法所得到的各类物体平均精度(Average Precision,AP)和数据集均值平均精度(mean Average Precision,m AP),仿真结果表明提出的多尺度卷积结构对目标检测精度的性能表现有所提升,m AP由75.3%提高到了76.4%,提高了1.1%,但速度每秒检测帧数(frames per second,fps)由16.5帧/秒,降低到了13.4帧/秒。2.针对MSSD算法降低了目标检测实时性的问题,在不影响算法检测精度的条件下提出了一种基于池化特征的先验框提取改进方案。将卷积特征图有效压缩成为池化特征图并针对池化特征图进行检测。由于检测特征图规模的缩小,先验框的个数也有所减少。在仿真中,将提出的先验框提取改进方案与MSSD算法相结合,仿真结果表明进一步改进后的算法将m AP由原SSD目标检测算法的75.3%提高到了75.9%,fps由16.5帧/秒提升到了19.1帧/秒,检测精度与速度同时获得了提升。3.针对交通场景中不同光照条件,不同背景中远距离车辆,交通灯小目标实时检测的问题,提出一种轻量级神经网络结构在现实场景下目标实时检测实际应用方案设计。采用了实际交通场景下的一种需要人为标注的数据集,该数据集包含了车辆,交通灯等信息。在轻量级卷积神经网络Mobile Net的基础上,结合SSD目标检测算法思想,提出了一种目标实时检测轻量级网络结构—微卷积神经网络(Micro Convolutional Neural Networks,MCNN),并设计检测流程与方案。最后在交通数据集中进行仿真实验,实现了该设计对小目标车辆交通灯在不同光照条件、远距离的检测,其检测速度可以达到27.1帧/秒,验证了本设计可以对交通场景下的目标进行实时检测。