论文部分内容阅读
随着科学技术的不断发展,计算机视觉领域中的目标检测技术已经被应用到人类生活的许多方面。例如安防、智慧城市、无人驾驶、智能机器人等领域都应用到了目标检测技术。由于应用场景的复杂性,目标的检测技术依然存在着许多挑战。近年来,Faster R-CNN算法在目标检测领域应用较为广泛。然而,该算法中存在以下两个问题:1)在卷积神经网络内部大量使用较小的卷积核,导致特征图长距离相关性较弱的问题。2)在特征金字塔网络内部存在多尺度特征融合不充分的问题。本文针对以上两个问题开展研究:1、针对Faster RCNN目标检测算法在卷积神经网络内部存在特征图内部长距离相关性较弱的问题,本文结合视觉注意力机制提出AT-FCNN(Attention-Faster Convolutional Neural Networks)目标检测算法。该算法将注意力模块嵌入到卷积神经网络内部,在卷积神经网络进行特征提取的过程中,通过注意力模块计算特征图内部特征之间的相关性系数,达到增强特征图表征能力的效果。最后,本文在公开数据集中对算法的有效性进行验证,实验结果显示本章算法在平均精确度值方面得到5.8%的提升。2、在Faster R-CNN算法框架内的特征金子塔网络中,由于原始特征融合策略采用深层特征图向浅层特征图融合的方式,使得浅层特征图充分包含了多层特征信息,而深层特征图并没有融合到浅层特征图的特征信息,最终导致多种尺度特征融合不充分的问题。本文针对上述问题,结合视觉注意力机制,提出ATF-FCNN(Attention Feature Pyramid-Faster Convolutional Neural Networks)特征融合算法。该算法首先将多尺度特征信息固定到同一尺寸,进行特征融合,并输出该种尺寸的融合特征图。其次,将融合特征图送入到注意力模块内进行处理。最后,将处理后的特征图采用上采样或者下采样的方式,重新转换成特征金字塔多尺度特征的形式,输入到下一阶段网络使用。本文在公开数据集中对该算法有效性进行验证,实验结果显示本章算法性能得到更进一步的提升。综上所述,本文通过基于注意力机制的Faster R-CNN目标检测算法的研究,其实验结果表明有效的解决了所提出的问题,并在算法整体性能方面的获得了明显的提升,达到了预期对目标检测算法学习与研究的目的。在目标检测方面给出了新的理论解决方案,同时具有较强的现实意义。