论文部分内容阅读
行人重识别是一项跨摄像头跨场景下搜寻与匹配目标行人的技术,该项技术在智能视频监控、智慧商业和智能安防等领域有着广泛应用,也是近些年计算机视觉领域的一个重点研究课题。但由于在自然场景下受到视角改变、行人遮挡、行人姿态改变等因素的影响,行人重识别面临着重大的挑战,如何提取更有辨别力的特征进行行人匹配仍是当前行人重识别研究需要重点关注的问题。本文基于深度学习方法针对行人重识别模型特征表示能力的提升进行研究,论文的主要研究工作如下:(1)针对当前的基于卷积神经网络的行人重识别方法对于遮挡和复杂背景引起的判别信息缺失问题,提出了一种基于多尺度卷积特征融合的行人重识别算法。在训练阶段,使用金字塔池化方法对卷积特征图进行分块和池化,获得包含全局特征和多尺度局部特征的多个特征向量;对每一个特征向量进行独立分类,并在各个分类的最后内积层上归一化权重和特征,以提升分类性能;最后使用梯度下降法优化全部的分类损失。在识别阶段,将池化后的多个特征向量融合成一个新向量,使用新向量在库中进行相似性匹配。最后在Market1501和DukeMTMC-re ID两个数据集上对所提算法的有效性进行实验验证,结果表明所提算法可以有效的提升行人重识别准确率。(2)针对现有的基于局部特征的行人重识别方法对于图片未对齐和行人姿态变化引起的特征判别能力弱的问题,提出了一种多任务金字塔重叠匹配行人特征的方法。在训练阶段,由主干网络提取特征图,经过金字塔重叠匹配网络获得全局向量和多个不同尺度特征的局部向量,这些向量使用三种损失函数联合进行学习,并使用特征归一化层来减弱损失学习目标不一致的影响,以提取更恰当的共享特征。在推理阶段,把各分支降维后的特征向量融合为一个新的特征向量,使用融合后的新向量进行相似性匹配。该方法在Market1501和DukeMTMC-re ID数据集上进行对比实验,结果表明,该模型提取的特征具有较强的鲁棒性和判别力。(3)针对基于局部特征的行人重识别方法存在模型结构复杂以及对低层有识别力的语义信息缺失的问题,提出了一种基于批特征擦除和多特征融合的行人重识别方法。首先通过残差网络分别提取出低层细节特征和高层语义特征,使用低层特征来弥补高层特征丢失的细节信息,其次对于高层语义特征使用批量随机擦除来获取有辨别力的局部特征,最后使用多种损失函数对于三种特征进行监督学习,测试时把三种特征融合为一个特征向量进行相似性匹配。在数据集Market1501和CUHK03进行实验验证,结果表明,该方法在不仅可以提升行人重识别准确率,也减少了模型的计算量,提升了算法运行速度。