论文部分内容阅读
行人检测作为目标检测的重要研究方向之一,多年来引起了人们特别的关注,并成为了理论研究和应用研究的热点,在智能监控视频、智能辅助驾驶、智能机器人等多个领域广泛被应用。而在实际应用中,由于摄像头拍摄视角受限,行人呈现尺度各异,小尺度行人所占比重较大,现有的目标检测器对小尺度行人的检测都存在局限性,因此,本文主要研究监控视频下的多尺度行人检测。论文对比研究了早期的行人检测算法和当前主流的基于深度学习的行人检测算法,探讨了影响行人检测的因素,并确定了基于深度学习的行人检测算法作为本课题研究的技术方案。针对多尺度行人检测,本文以Faster R-CNN的思想作为思维导向,提出了一种新的端到端的多尺度并行通道级联网络的行人检测算法。首先,研究了卷积神经网络不同层所提取的特征通道信息在表达行人特征中的不同表现特性,因此提出了一种全新的通道级联网络结构。在此基础上搭建并行通道级联网络以引入行人运动特征。其次,设计了多尺度行人区域建议网络,该网络利用通道注意力机制对图像特征通道重新赋予权值以调整特征关注域,再通过自适应地学习适用于行人的参考框来获取高质量的行人候选区域。最后,联合训练并行通道级联网络和多尺度行人区域建议网络,结合深度网络训练中常用的技巧,训练端到端的多尺度并行通道级联行人检测网络。在检测过程中,利用超分辨率重建技术恢复更多小尺寸行人的细节纹理信息,再送入检测网络中进行检测。为了验证所提出算法的有效性,本文建立了广角视频行人数据集,该数据集中行人分布密集、尺度范围广且小尺度行人居多。在该数据集上,本文提出的多尺度行人检测算法获得了极具竞争力的结果,特别是小尺度行人检测。同时,本文所研究的内容也适用于其他的目标检测,如交通灯检测、车辆检测等。