论文部分内容阅读
随着近几年人工智能的兴起以及快速的发展,深度学习的研究方法逐步的和一些计算机领域的传统研究方向深度融合,取得了一些不错的成果。计算机视觉领域是深度学习最早取得突破的领域。随着计算机硬件的发展,计算机硬件能力的提升和成本的降低也使得深度学习所需的计算能力更易于获取。在计算机视觉领域中不断地有各种关于卷积神经网络在目标识别上的应用,从最早出现的Alex Net网络模型到如今基于端到端的SSD网络模型,关于目标识别的研究获得了快速的发展。基于深度学习的目标检测技术由于具有可靠的优势,即更高的准确率、以及更强的鲁棒性,同时还有实时性,逐渐取代了传统的目标检测技术。但是,面对新的技术变革就有产生新的挑战,随着复杂场景的出现,由于深度学习所训练的数据集大部分是基于现有的数据集进行训练和预测的,因此往往在针对中小目标占比的特征信息进行预测时会遗漏很多细节特征,从而导致相关的网络模型的检测能力受到制约。这也成为了提升并优化网络模型时所必须面对的一个关键问题。因此,针对该问题本文主要从两方面进行了相关的研究工作:(1)本文在对经典的目标检测网络进行研究分析后,选择了当下最为流行的多尺度卷积特征检测的网络模型即网络模型进行优化。对SSD网络模型的各个卷积层以及各层的特征图分析后,针对检测小目标的检测能力不足的问题,对浅层网络采用了联系上下文信息的思想,即采用了基于残差网络思想的方法对Conv4进行了网络结构的改进;并且针对浅层卷积层的语义信息丰富度不足的问题对Conv4_3和Conv5_3的特征图进行了特征融合,设计了新的SSD网络模型,将改进浅层卷积层后输出的特征图用于卷积检测层的目标检测。实验结果表明,改进后的模型SSD_Fusion V1的检测效果在中小目标的检测上有了相对明显的提升。(2)在第一部分研究工作基础上,针对SSD网络模型额外卷积层Conv7对于细节信息表现不足的问题,将其和Conv3_3特征图进行特征融合,增强该层特征图对中小目标细节信息的表现能力;针对前后两次改进过后的SSD网络模型输出的目标建议区域采用目标特征区域映射放大的方法,使得改进后模型输出的目标特征信息经过区域映射后得到细节更为丰富的新的目标区域信息特征图。实验结果表明,经过两次改进并采用区域映射放大机制的最终模型SSD_Fusion V2对本文特定类别在中小目标对象的检测上以及在公开数集上和其他经典的算法的检测效果相比,其检测效果相对于原模型SSD有了较为明显的提升。综上所述,本文主要从SSD基础网络Conv4卷积单元网络结构、Conv4浅层卷积层输出的Conv4_3特征图、Conv7卷积层输出的特征图着手,运用特征融合方法、借鉴残差网络结构、以及采用目标区域特征映射放大的方法来提高中低卷积层对检测目标细节信息的表现能力,最终改善了原网络模型SSD对中小目标对象检测率低、精度不高的问题。