无重叠视域下行人再识别算法的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:wecan626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人们自身公共安全意识的提高以及视频监控技术的发展,智能视频监控系统得到了大量的普及。行人再识别(Person Re-identification)是近几年智能视频分析领域兴起的一项新技术,是多摄像机联合智能视频监控系统中需要解决的关键问题之一,因而得到了广大计算机视觉领域及人工智能领域相关人员的关注。无重叠视域下的行人再识别是指在一个多摄像机联合的视频监控系统下,判断一个摄像头中出现的行人目标是否在另一个非重叠视域监控下的摄像头中出现过的一个过程,即识别出不同摄像机拍摄到的属于某一个行人的图像。但由于受摄像机角度、背景变化、光照条件、姿态变化、遮挡等多种外在复杂因素的影响,同一行人在不同视域下可能存在很大的差异性,从而使得行人再识别问题具有很大的挑战性。本文提出了一种基于度量学习的行人再识别算法PRML(Person Re-identification based on Metric Learning),主要通过特征学习生成一个测度矩阵来进行行人的再识别。本文首先通过一种图像增强算法对原始行人图像进行处理,从而减少因光照变化所带来的影响,然后根据人体目标外观形态特性对行人进行合理分割,并提取行人图像颜色特征(HSV、Lab)、纹理特征(SILTP、FHOG)以及颜色属性ColorNames特征并进行核函数学习,将原始线性特征空间投影到更加具有区分性的非线性特征空间并对特征进行PCA降维,之后考虑到不同类型特征对行人图像描述的差异性,分别学习得到三个独立的测度矩阵,并通过正则化方法来优化测度矩阵的过拟合问题,最终并加权融合多个测度矩阵综合得到行人图像对的相似性度量函数,从而实现行人相似性的度量。最后在VIPeR、iLIDS、CUHK01三个公共数据集上采用CMC(Cumulative Matching Characteristic Curve)曲线评测标准对提出的算法进行了实验效果验证、对比和分析。
其他文献
为了满足用户对无线通信系统日益增长的速率需求,现今的通信系统广泛采用多天线技术和全频率复用以提高系统的频谱效率。因此小区间干扰不可避免地成为了限制系统性能的重要因
构造变形下的烃类充注物理模拟实验是探究地质构造特征、形成和演化机制的重要方法,对油气田勘探开发具有重要意义。课题以断层封闭性和构造地质学理论为指导,以机械设计加工
现代通信系统及相关设备中,噪声使得接收端恢复出的信号与发送的信号存在着偏差。然而在某些非线性系统中,输入信号和噪声在输出中表现出协作效应,这种随机系统的协作现象即
随着3G (3rd-generation,第三代移动通信技术)和移动互联网的发展,移动互联网的3G数据业务将是电信运营商竞争的重点。而当前的3G系统不能满足移动互联网高速率数据业务的需
双目立体视觉是计算机视觉的一个重要分支,在智能交通领域发挥着重要的作用。论文研究了基于双目立体视觉的测速方法和机动车桩考环境下的车辆三维重建算法,以期更好地解决二
互联网技术的飞速发展和数字图像设备的普及,使得大容量图像数据库在各种领域有了广泛应用,在一定程度上推动了图像数据库管理的发展。基于内容的图像检索技术(Content-based I
离散傅里叶变换扩频正交频分复用(DTF-SOFDM)技术是3GPP中LTE上行链路的一种重要的传输方案,DFT-SOFDM技术是在OFDM与单载波频域均衡技术的基础上发展起来的,汲取了两者的优
国外不少公司研制的牙科图像数字化系统,已经在临床医学中取得了较好的效果,但是由于进口设备价格昂贵,限制了在牙种植应用中的普及。本文所研究的牙科数字化全景机不需要繁
AVS作为我国具有自主知识产权的新一代数字音视频编解码标准,在网络多媒体、高清数字视频等应用方面表现出较低的复杂度和良好的性能。在画面质量同等的前提下,AVS标准的数据
随着移动通信和宽带无线接入技术的飞速发展,各种无线接入技术相继出现,它们有着各自不同的特征和业务提供能力,彼此之间既相互补充又相互竞争,共同构成了一个异构的网络环境