论文部分内容阅读
目标检测是计算机视觉领域中的研究热点,它是指从输入的图像或视频中判断是否包含物体,并对检测到的物体进行分类和定位,目标检测为其他的计算机视觉任务提供基础的图像/视频信息数据。随着近几年基于卷积神经网络的深度学习算法的迅猛发展,基于深度学习的目标检测算法已经有了长足进步,因其较传统目标检测算法检测精度更高、速度更快的优点,目前已成为目标检测领域的主流算法,但仍然存在对小目标的检测精度较低,检测速度不能达到实时检测要求的缺陷。首先,本文介绍了基于深度学习的目标检测算法的基础理论,对深度学习的要点、卷积神经网络的前身—多层感知机、卷积神经网络的基本原理与其主要的构成部件、几种经典的卷积神经网络和目标检测算法做了概述,该部分是后续改进工作的基础。其次,本文针对基于深度学习的目标检测算法中存在的上述缺陷,提出了基于YOLOv3算法改进的DB-YOLOv3目标检测算法。DB-YOLOv3算法针对YOLOv3算法对小目标检测不准确的缺陷,提出了基于Inception结构改进的Downsample Block对YOLOv3中的特征提取网络进行了改进,Downsample Block利用不同大小感受野的卷积和池化对特征进行提取,减少了特征信息在提取过程中的损失,同时,DB-YOLOv3算法提高了深层高语义信息的复用。DB-YOLOv3算法有效减少了特征信息在传递过程中的损失,同时减少了模型的参数,使得模型的检测精度和速度得到了显著提升。最后,本文在经典的SSD算法的基础上,针对SSD算法对小目标检测效果差的缺陷,设计了基于反卷积操作和特征通道融合的DFF模块,并利用DFF模块对SSD算法的检测网络进行改进,提高了检测网络中深层高语义特征的复用,增强了浅层高分辨率特征和深层高语义特征的联系。实验结果表明,改进后的DFF-SSD算法显著提高了对小目标检测的效果。