论文部分内容阅读
近年来,以卷积神经网络为代表的人工智能技术促进了计算机视觉领域的发展和实际应用。目标检测因CNN模型的成功应用而取得了很大的进步,各种先进的目标检测器层出不穷,推动了以目标检测为基础的计算机视觉技术的落地应用。基于CNN模型的目标检测器的骨干网络不仅对最终检测有影响,而且对检测头的性能发挥也有影响。研究者们以图像分类模型为基础,提出并改进了一系列用于目标检测的骨干网络。以特征金字塔结构为代表的骨干网络因对小目标效果好并能适应目标的多尺度变化,成为目标检测模型中必不可少的部分。然而,现有基于特征金字塔及其改进的目标检测器也面临着诸多问题和挑战。首先,现有基于FPN及其改进的目标检测器在特征融合上存在不足。其次,现有基于FPN的目标检测器的骨干网络深度与特征提取性能之间存在矛盾。针对上述两个的问题,本文进行了如下研究:第一,本文分析了现有基于FPN及其改进的目标检测器特征融合存在的不足,提出了一种基于TFPN的目标检测网络。为保证FPN模型在小目标检测上的优势,本文以原FPN网络(F塔)为基础,提出了S塔和E模块。其中S塔是在FPN的基础上添加的一个小特征金字塔,它通过进一步融合上下文信息有效提升了中目标的检测效果。而E模块通过有效融合F塔的浅层特征和S塔的特征有效提高了模型在大目标上的检测性能。以这三个部分为基础我们设计了一种基于TFPN的目标检测网络。大量实验证明,与以往基于FPN及其改进的目标检测器相比,基于TFPN的目标检测网络能同时提高小、中、大目标检测性能。第二,本文分析了现有基于FPN的检测器骨干网络深度与特征提取性能之间存在的矛盾,提出了一种基于Cascade FPN的目标检测模型优化方法。该方法有如下优点:一是以一种参数量和计算量都较少的Conv Block为基础构建了轻量级FPN,有效减少了网络横向扩展加深带来的冗余;二是以特征融合模块FFM为基础构建了上下文信息融合机制,在横向级联扩展轻量级FPN的同时,充分融合了上下文信息。实验结果表明,在纵向加深骨干网络的同时在横向方向上适当的扩展轻量级网络,能在带来较少冗余的条件下有效提高目标检测的效果。