论文部分内容阅读
近年来,随着公共安全问题受到了越来越多的关注,监控系统已经被广泛地运用到了社会的各个角落,也因此产生了大量的数据,要在众多视频数据中快速搜寻和追踪目标行人就显得越来越困难。为了减轻监控人员的工作量以及增加搜寻效率,行人重识别(Person re-identification,re-ID)方法已被作为当前学者研究的热点之一。行人重识别是指能在多个不重叠的摄像头中检索出目标行人的一种算法。行人重识别方法最初是通过运用计算机图像处理技术去提取到行人的直方图特征,再通过距离度量去计算行人的相似度。由于这种方法提取特征较为复杂,且识别率并不高,导致其逐渐无法满足人们的要求。随着近年来卷积神经网络在图像识别领域取得的越来越多的应用和突破,将卷积神经网络应用到行人重识别算法中已逐渐成为目前热门研究内容之一。但是在行人重识别领域中仍存在着诸多挑战:由于监控系统中的摄像头分布在各个不同的区域,摄像参数参差不齐,且行人的行为和姿态不断变化,从而会导致同一行人在不同摄像头中的表现不一致的问题;此外,在摄像头画面中目标行人还会被其它行人或物体所遮挡,这也极大地提高了行人重识别的算法的难度。针对行人重识别中存在的问题,本文设计了一种端到端的行人重识别模型,该模型利用卷积神经网络去提取行人的全局特征,通过引入注意力机制对齐行人部位,提取到行人部位上的细粒度特征,可以极大地提高行人重识别的准确率。同时引入具有语义不变性的属性信息,将属性信息与行人部位一一对应,设计出了相应的损失函数,通过优化训练,使模型学习到行人部位的属性,从而让注意力机制能进一步精准地定位到行人部位。最后,本文提出的基于注意力机制和属性学习的行人重识别算法在公开数据集上通过实验仿真,取得了较高的准确率,与近几年来先进的算法进行比较,尤其是在处理行人不对齐、被遮挡的问题上,表现出良好的性能,证明了本文算法的优越性。