论文部分内容阅读
近年来,得益于卷积神经网络的强大表征能力,行人检测系统取得了突破性进展。一般而言,卷积神经网络的浅层特征映射表示图像的细节信息,深层特征映射表示图像的语义信息,并且深层特征与浅层特征皆是行人分类与定位任务中不可或缺的成分。然而已有的行人检测方法多数集中在浅层特征与深层特征的融合层面上,未能对融合后的特征进行更深层次的分析,导致提取后的行人特征存在无关信息,误检率也不能达到最低程度。为了解决这一问题,本文以改进现有的经典卷积神经网络入手,利用相关技术提取行人的浅层和深层特征,并通过某种特定的手段处理融合后的特征通道,以此实现提升行人检测器性能的目的。全文的主要工作如下:1.以全卷积区域提议网络(Region Proposal Network,RPN)和Fast RCNN(FRCNN)为检测基准,提出了一种自适应特征通道的行人检测方法。该方法的改进主要集中在目标的深层特征映射上,其主要改进在于:(1)利用设计的浅层特征通道模块(Shallow Feature Channel Module,SFCM)提取基础卷积神经网络的浅层特征,并融于深层特征中,从而提升深层特征通道表示特征的全面性。(2)在融合后深层特征通道中应用自适应特征通道模块(Adaptive Feature Channel Module,AFCM),通过该模块的挤压、激励以及权重重标定功能,更新对应的特征映射值,使网络能够有效的学习强辨识力行人特征并进行分类与定位任务,以此实现自适应特征通道的行人检测方法。为了验证该改进点的有效性与优越性,本文通过所提模块的逐一添加对其有效性进行评估,并在公开数据集上对比所提方法与已有行人检测方法的性能,实验表明,该方法具有一定的优越性。2.在多任务学习中,辅助任务能够促进模型更好的学习特征,因此本文为了进一步优化检测模型,在上述检测算法为基础,结合多任务学习技术,提出了联合弱分类监督与自适应特征通道的行人检测方法。该方法的改进仍然集中在深层特征映射上,其主要改进在于:(1)优化了Body模块,利用空洞卷积替换下采样操作以及卷积操作,使网络能够有效避免下采样操作造成的小尺度行人信息丢失,同时扩大图像的感受野,以此提升网络模型检测小尺度行人的性能。(2)以行人检测框的面积为监督信息,在AFCM模块中添加弱分类监督分支,从而增强模型学习行人特征的能力。(3)实现端对端的多任务训练。实验表明,该检测算法具有一定的竞争性。