论文部分内容阅读
近年来,作为安全防范领域的重要手段之一,智能视频监控系统在安防中的需求与日俱增。行人重识别是智能监控系统中一项重要技术,目前已经成为图像处理领域中的一个热点话题。行人重识别指的是在某一摄像头下指定一个目标行人,然后在其它不同区域的摄像头下对该目标行人进行查找和识别的技术。由于光照变化、遮挡、拍摄角度等多种因素都可能影响到识别性能,如何提高行人重识别技术的识别率仍然是一个挑战性的问题。目前,深度学习已经成功应用在图像检测、目标识别、图像分类、语音识别等多个领域,同样也在行人重识别领域有一定程度的研究。跟传统的特征提取方法相比,深度学习网络能够自动从图像中学习到更鲁棒更具有代表性的特征。因此,本文在研究深度学习和神经网络等理论的基础上提出了一种基于卷积神经网络和混合高斯的行人重识别方法。2017年,在计算机视觉与模式识别会议(CVPR,Computer Vision and Patern Recognition)中,郑良等人提出了一种IDE行人重识别算法,本文方法是对IDE算法的一个改进。该方法首先将数据集中的所有行人图像送入到卷积神经网络(CNN,Convolutional Neural Network)中,对图像进行特征的提取;然后利用K均值聚类算法,对提取的特征进行聚类,生成字典;再根据字典中的词汇构建混合高斯模型(GMM,Gaussian Mixture Model),其中字典中的各个词汇作为各个高斯的均值,各个高斯在混合高斯中的权重是量化到各个词汇的样本个数占总样本的比例;接着把提取的CNN特征代入混合高斯模型中进行特征表示,其具体做法是:先求该特征在各个高斯下的概率密度,然后用该概率密度和对应的高斯在混合高斯中的权重相乘,得到一组概率值,对该组概率值按降序排列,得到最大索引号对应的高斯]用该高斯的均值对CNN特征进行表示,得到量化特征;提取各个摄像头下各个行人的视频序列特征,特征为对应视频序列中所有图像的量化特征均值;最后把两两摄像头下行人的视频序列特征作为输入,通过XQDA距离度量学习来判断对应的行人是否为同一行人。实验结果表明,与IDE算法相比较,本文所提出的基于卷积神经网络和混合高斯的行人重识别方法具有更高的行人重识别率。在相同的两个摄像头下对行人视频序列所提取的CNN特征,经过了本文中所提出的混合高斯模型的处理后,得到的行人量化特征的识别率更高一点,该行人重识别的识别率比直接提取CNN特征并进行识别的识别率高出将近8%~9%,最高的识别率甚至达到了 86.76%。因此,本文中所提出的基于卷积神经网络和混合高斯的行人重识别方法,可以很好的应用于监控视频系统中的行人重识别技术。