论文部分内容阅读
目标检测是计算机视觉中基础且主要的技术之一,其应用也十分广泛,包括智能安防与监控系统、智能交通与驾驶系统、互联网移动端领域和军事应用领域等。目标检测的目的是从复杂的图像中识别出目标的类别并给出目标在图像中具体的位置信息,因此目标检测任务包含了目标分类和目标定位两个重要的子任务。与传统的目标检测方法相比,基于R-CNN系列的两阶段目标检测方法免去了人为提取特征的主观片面性,同时实现了目标特征提取与分类过程的二合一。而针对两阶段目标检测器速度较慢的问题,基于直接回归的单阶段目标检测方法由于不需要区域推荐环节而是通过在图像的多处位置直接回归得到目标的类别和边框来完成目标检测。但是,基于R-CNN系列的两阶段目标检测方法和基于直接回归的单阶段目标检测方法都存在对小目标检测准确率不高的问题,因此,本文的主要改进思路在于:模型在保持对大目标检测准确率的同时还能显著提升对小目标检测的准确率。同时也使用测试速度、收敛速度等作为辅助评估指标。基于以上的思路,本文的主要工作有:1.本文首先提出了一种基于深浅层CNN(Deep and Shallow CNN,DS-CNN)并联的目标检测模型。首先,为了减少小目标信息的损失并保持大目标的检测准确率,本文设计了适合提取小目标信息的浅层神经网络,并利用扩张卷积理论重新设计了深层神经网络,运用跨层连接将深浅网络进行有机并联以提取目标的底层图像特征和高层语义特征。然后,为了提高目标候选区推荐机制的检测速度与精度本文借鉴了Faster R-CNN中的区域推荐网络(Region Proposal Network,RPN),并创新了目标候选框生成的RPN机制。最后,为了减少全连接层导致的参数冗余,本文使用感兴趣区池化层和单核卷积层设计了新的特征降维器,以加速目标检测的速度。实验结果表明,DS-CNN模型在保持大目标检测准确率不变的同时还显著地提升了对小目标检测的准确率,且目标检测速度没有明显降低。2.在DS-CNN模型的基础上,本文提出了基于对抗迁移的缩聚与激发检测网络(Sequeeze and Excitation CNN,SE-CNN)。首先,为增强网络对图像特征的提取能力,本文在DS-CNN的深层和浅层网络中分别嵌入SE模块,以重新调整通道关系。然后,为提高对样本的检测能力,本文使用迁移学习的思想,把能产生困难样本的ASDN(Adversarial Spatial Dropout Network)迁移到DS-CNN模型中。最后,为解决ROI Pooling操作容易造成的位置偏差问题,本文应用ROI Align层以重新设计特征降维器,以加强小物体的检测能力。实验结果表明,SE-CNN模型提高了所有类别的检测能力,尤其是小型物体,且收敛速度得到明显提高。