论文部分内容阅读
目标检测是计算机视觉领域的基本任务之一,而设计高效的目标检测算法一直是研究者们所追求的。本文从深度学习中的多尺度特征角度出发研究特征多层融合方法,同时将高阶特征和位置敏感的权重网络相结合。本文首先从多层特征融合角度出发,分别研究基于Faster-RCNN的多层特征融合方法和基于特征金字塔网络(FPN)的多层特征融合方法。在这两类方法中,基于Faster-RCNN的方法只有一个预测组件,而基于特征金字塔网络的方法有多个预测组件,所以研究它们各自的多层特征融合策略是必要的。针对这两类方法,本文提出了两种多层特征融合策略,并在PASCAL VOC数据集上进行了验证,有效地提升了目标检测精度。除了多层特征融合策略的研究之外,本文提出了多尺度的位置敏感的核函数特征表达方法(MLKP)。MLKP提出了一种高阶特征在目标检测领域的应用方法,同时设计了位置权重网络,并将二者结合在一起。高阶特征的使用是一种特征增强方法,可以提升模型对小目标的检测能力。通过利用目标位置的统计学信息,位置权重网络可以对特征图进行加权操作。在特征图中,并不是所有区域都会有目标出现,位置权重网络可以对存在目标的区域进行增强,同时对不存在目标的区域进行削弱,达到提升目标检测效果的目的。与此同时,我们也对多尺度的位置权重网络进行研究,并分析其优劣。最后,MLKP算法在两类公开的数据集(PASCAL VOC和MS COCO)上进行了验证,都取得了当前最好的结果。