论文部分内容阅读
随着社会的发展和公共安全意识的提高,监控探头出现在生活的各个角落,这有效的预防一系列暴力违法事件的发生,可即便如此,在公安侦查人员跨摄像头追捕嫌疑人时依然存在很多问题。为了解决跨摄像头场景下行人的识别与检索问题,行人重识别应运而生,且成为了计算机视觉方向的研究热点。行人重识别的优势是可以在没有获得清晰人脸照的同时也能对特定行人进行锁定,实现跨摄像头的连续追踪。在行人重识别的研究中最常用的方法是监督学习,监督学习需要依赖完全的数据标记,而对每个训练集里的人在不同摄像头下的数据进行标注的代价很高。与监督学习方法对应的是无监督学习,无监督学习不需要进行数据标注,但是由于缺乏标记数据的指引而导致实验结果难以令人满意。介于监督学习和无监督学习方法之间的是弱监督学习,弱监督兼具监督学习和无监督学习的优点,既可以利用有效的监督信息也能充分利用未标注的数据,所以弱监督学习成为了研究热点。在具体的以较弱的监督方式训练CNN模型方法中,最常用的就是数据风格迁移和单样本标注。数据风格迁移是指两个数据集的风格互换,使得原数据集A有数据集B风格的图片。单样本标注是指数据集中的每个行人只有一个标注的样本和多个未标注的样本,然后通过渐进式框架逐步利用未标注数据。具体的做法就是使用少量的有标签的数据训练一个CNN模型,然后用训练得到的模型为无标签的数据预测标签(伪标签),最后使用预测得到的伪标签数据和原有的少量标签数据重新训练模型。但是由于不同摄像头下图片的角度、色差、背景等都不同,使得拍摄的同一个行人的图片差别很大。当只标注一个样本时,缺少了图片进行跨摄像头的学习,而导致识别效率不高。针对以上弱监督行人重识别研究中的问题,本文提出了以下方法:(1)本文提出了新的单样本标注方案,即通过CycleGAN[1]进行不同摄像头图片风格的互相转换,以实现跨摄像头下的每个行人在每个摄像头风格下都至少有一张标注的图片的目的。使得每个行人在所有不同的摄像头风格下都有一个标注的图片,这样做的目的是有效地解决单样本标注的图片不具代表性的问题。(2)本文提出原始数据集单标注样本和摄像头风格迁移数据集单标注样本共同训练CNN模型。仅使用单一风格摄像头风格的数据集进行初始化的CNN模型,识别性能不高。使用每个行人的真实图片和跨摄像头风格迁移图片共同初始化,会增强CNN模型的鲁棒性。在训练过程中,使用迁移数据和原始数据一起训练,大大提升了re-ID性能。在寻找可信图片赋予伪标签方面,本文提出计算原始数据集图片特征,从原始图片和摄像头风格迁移生成的图片中随机选择一部分赋予伪标签并投入迭代训练模型中。大量的实验表明了本文提出的方法在弱监督行人重识别中的优越性。