论文部分内容阅读
目标检测是计算机视觉领域的一个十分重要的研究方向,其定义为计算机自动识别给定的图像或视频中特定目标的类别及其在图像或视频中的具体位置。目标检测是分割、场景理解、目标追踪、图像标注及事件检测等高层视觉应用的重要理论基础,同时被广泛应用于机器人视觉、视频监控、自动驾驶、新零售等应用场景。小目标是指其分辨率较低或其大小相对图片或者视频尺寸较小的目标,即小目标所具有的特征有限,且在特征提取过程中更容易受到背景噪声的干扰;此外,检测小目标复杂度更高,无法实现快速检测。目前基于深度学习的目标检测方法在该领域处于绝对领先地位,因此研究基于深度学习的小目标检测算法不仅具有重要的学术价值,还有着实际的应用价值。本文针对目标检测算法SSD在小目标检测上存在的不足进行了改进,主要研究内容如下:1、提出了基于空洞、转置卷积的SSD加强小目标特征的融合方法。该算法在浅层特征上使用空洞卷积模块用来提升感受野、同时保持其分辨率大小以适应预设框的大小;在深层特征上使用转置卷积用来提高特征分辨率以保证其可以与浅层特征结合,将高层语义信息引入浅层,提升小目标检测的效果。该算法能有效地对小目标进行检测。2、提出了基于目标检测特征提取网络DetNet的小目标检测方法。该算法将FSSD算法的基础网络更换为DetNet,并修改其特征融合层以更好的配合基础网络的使用,提升对于小目标检测的能力。在PASCAL VOC和MS COCO数据集上的实验结果表明,该算法能快速高效的对小目标进行检测。3、提出了基于模型剪枝的快速高效的小目标检测方法。该算法首先修改了FSSD的特征融合层,增加了小目标检测层的通道数,同时通过增加批规范化层进行稀疏化训练,训练完成后根据通道缩放因子进行剪枝,剪枝后继续微调得到最终的剪枝模型。实验结果表明,修改后的模型及剪枝模型都取得了速度和精度上的良好平衡,剪枝模型可以达到实时性的检测。