论文部分内容阅读
行人重识别问题是一个跨摄像机的行人检索问题,即给定一个需要查找的行人,识别该行人是否出现在另一个摄像机的监控记录中。在保障公共安全的实际需求下,随着公园、街道等场所监控摄像机数量的不断增加,行人重识别技术在智能监控系统中的应用势在必行。然而,由于不同摄像机拍摄的图像在背景、光照、姿态和分辨率等方面存在很大差异,行人的特征提取面临着巨大的挑战。此外,行人图像中普遍存在的遮挡问题也增加了行人重识别的难度。因此,提取鲁棒的特征描述子并设计合适的判别方法就成为了解决行人重识别问题的关键。近年来,深度学习的方法不断应用于行人重识别领域中并取得了良好的效果,极大地推动了行人重识别技术的进步。现有的大量深度学习方法都属于有监督学习的方法,需要对大规模已标记的数据集进行学习。而现有的行人重识别数据集规模较小,难以模拟现实场景,大规模的数据标注又需要耗费大量的人力资源。因此,为了降低数据标注的成本,提高行人重识别方法在实际场景中的可用性和可扩展性,基于无监督的行人重识别方法也成为了这一领域的一大研究方向。针对上述问题,本文进行了以下研究:1)提出了一种基于图像-空间特征融合的有监督行人重识别方法。首先,根据图像特征提取空间特征,定位图像中的行人,然后通过融合图像特征和空间特征,让模型更多地关注图像中的前景行人而非杂乱背景,解决了背景杂乱的问题。其次,将融合后的特征水平均分为若干个局部特征,分别对每个局部特征进行行人身份的判别,解决了行人遮挡问题。接下来,利用局部特征训练分类损失,利用全局特征训练三元组损失,最终提出了一个由分类损失和三元组损失加权组成的目标函数。该方法可以训练出更具判别性的特征,有效提高了行人检索的效果。2)提出了一种基于局部特征融合的无监督行人重识别方法。针对无监督下的度量学习问题,提出了一种新的基于无监督的三元组损失。对每个训练样本,通过图像的剪裁、亮度调节等随机变换生成难正样本,通过提出的难负样本挖掘算法挖掘难负样本。该损失不受限于网络结构和研究领域,是一个适用于无监督学习的度量学习方法。同时,该损失应用在融合局部特征的网络结构中,该网络利用局部特征的优化挖掘了图像中的细粒度信息,有效提高了无监督场景下行人重识别的性能,解决了手动标记数据成本高的问题,提高了行人重识别方法在实际场景中的应用能力。该论文有图16幅,表21个,参考文献78篇。