论文部分内容阅读
随着监控设备成本的降低,视频监控系统在许多领域都得到了大量的应用。通过人工的方式对海量的监控图像进行观察和处理的工作变得越来越繁重,因此计算机视觉技术应运而生,通过计算机对监控图像进行处理从而取代人工的方式,使得人们的工作效率得到极大的提升。其中,行人再识别是计算机视觉领域里一个非常重要的技术。行人再识别指的是在非重叠视域多摄像机监控系统中,匹配不同监控画面中的目标行人。该技术为公安提供有用的线索、帮助寻找在公共场所跟家人分开走丢的小孩、非重叠多摄像机系统中的行人跟踪等智能监控领域都有着广泛的应用。但是在不同的监控摄像头下,行人图像受到光照、视角和行人姿态等变化的影响,在视觉上容易形成很大的外观差异,使得行人再识别问题遇到了很大的挑战。在面对这些挑战,如何去建立一个特有的,健壮的代表特征来描述在各种变化环境下的行人外观,以及如何去得到一个有效的距离度量学习算法。本文针对基于距离度量学习的行人再识别问题进行了研究与讨论,主要研究成果包括以下几个方面:(1)针对当前的行人再识别在度量学习上采用马氏距离相似度函数,而该相似度函数的计算过程只跟特征差分空间有关,而一对行人图像中每个独立个体的外观特征没有得到重视。本文提出了通过学习一个双向关系相似度函数(Bidirectional Relationship Similarity Function,BRSF),来计算一对行人图像的相似度。BRSF不但描述了一对行人图像特征的互相关关系,而且还关联了一对行人图像特征的自相关关系。本文利用KISSME(Keep It Simple And Straightforward Metric)算法的思想进行相似度函数学习,把一对样本图像特征的自相关关系和互相关关系用高斯分布来表示,通过把最终高斯分布的比值转换为BRSF的形式,得到一个对背景、视角、姿势的变化具有鲁棒性的相似度函数。实验结果表明,本文算法与已存在的行人再识别算法相比较,行人再识别率得到了显著的提升。(2)针对行人图像受光照、视角和行人姿态等的变化影响,以及行人图像特征在原始特征空间的线性不可分,这样学习得到度量矩阵,进而得到表示样本之间相似度函数不能准确地表示样本之间的相似性和差异性,从而导致识别效果较差。本文提出了一种在核空间学习稠密水平条带特征的行人再识别算法。算法首先通过自顶向下的滑动水平条带提取每个水平条带的颜色特征和纹理特征,然后融合行人图像的多种特征,映射到核空间,最后在核空间里学习得到一个对背景、视角、姿势的变化具有鲁棒性的相似度函数,通过比较相似度来对行人进行再识别。实验结果表明,本文算法与已有的行人再识别算法相比,得到更具有区分性的行人图像特征和更有效的相似度函数,行人再识别率得到了显著的提升。