论文部分内容阅读
随着人们对社会安全关切度的提高以及视频监控技术的发展,越来越多的监控摄像机被部署在各种公共场所。传统的视频监控依赖于人工浏览视频的方式查找目标,但随着监控系统规模不断扩大,视频监控数据规模以指数级别增长,人工查找的方式将无法满足海量数据的需求。行人重识别是利用计算机视觉技术判断图像或视频中是否存在目标行人的技术,其在智能监控、无人超市以及城市秩序管理等领域有着广泛的应用前景。近年来,行人重识别已成为计算机视觉领域的一个重要方向。由于实际监控场景下同一行人的外貌特征会受到行人角度、姿态变化和背景干扰等因素的影响而发生巨大变化,本文围绕行人重识别中的两个关键难点“角度变化”和“背景干扰”进行了重点研究,主要内容如下:1.针对角度变化造成的行人图片外貌特征发生巨大变化的问题,本文提出了一种基于角度注意的行人重识别方法。通过研究发现角度相似和角度不相似的行人图像对的关联性特征存在明显差异性。当行人图片对角度相同时,可以通过一些细节特征来判断这两张图片是否为同一行人;当行人角度发生显著的变化时,一些细节特征可能会丢失,因此需要学习对角度变化更鲁棒的特征。如果对角度相似的图像对和角度不相似的图像对提取统一的特征,则很难在不同的关联性特征之间找到一个平衡。本文利用角度作为辅助信息将行人图像对分为角度相似和角度不相似的图像对,然后利用两个权重不共享的全连接层将角度相似和角度不相似的图像对分别投影到不同的特征子空间中,最后使用多个度量损失来共同监督网络的学习。通过在三个常用的行人重识别数据集CUHK01、CUHK03和PRID2011上进行的实验证明了该方法的有效性。2.针对相似背景会对行人身份匹配造成干扰的问题,本文提出了一种基于语义分割的行人重识别方法。由于现有的数据集仅由少量摄像机捕获的行人图像组成,对图像中的所有像素进行同等处理会在相似背景的图像之间产生高度相似性。本文构建了一个语义分割子网络和行人重识别子网络的联合框架。使用语义分割网络输出的行人mask作为辅助信息指导行人重识别网络学习,使网络聚焦于行人区域以便学习更具辨别性的行人外貌特征。同时,针对语义分割模型中存在的行人关键部位丢失和轮廓不清晰问题,将行人重识别网络的中层特征和语义分割子网络融合以辅助分割任务。通过在CUHK01、CUHK03和大规模行人重识别数据集Market-1501上进行实验的证明了该方法的有效性。