复杂场景下的行人重识别关键技术研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户：xincuntianxia

【摘要】

：

社会的快速发展和人们日益增长的安全需求推动了视频监控的迅猛发展,行人重识别在安全监控、刑事侦查和目标再识别应用中具有重要作用,并在机器视觉和人工智能领域引起了广泛

【作者】

：

马飞

【出处】

：

武汉大学

【发表日期】

：

2019年01期

【关键词】

：

行人重识别半耦合映射学习度量学习字典学习异质样本匹配模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

社会的快速发展和人们日益增长的安全需求推动了视频监控的迅猛发展,行人重识别在安全监控、刑事侦查和目标再识别应用中具有重要作用,并在机器视觉和人工智能领域引起了广泛关注。大量的研究人员投入到行人重识别研究领域中,并取得了丰富的研究成果。目前大量的行人重识别研究主要是集中在正常场景下进行开展的,即行人与相机的距离基本固定、光照相对充足以及遮挡较少等场景,针对行人重识别中出现的问题提出了对应的解决方案并获得了良好的效果。但在实际场景中,由于天气的变化、行人的运动、相机的分辨率以及光照的变化等因素,这些变化的不利因素增加了行人重识别研究的难度,使得行人重识别研究更具有挑战性。(i)由于受到存储设备容量的限制以及可能出现的色彩线路故障等因素,导致获取的样本没有RGB彩色信息而只保留了灰度信息。目前还没有一个公开的灰度行人视频标准数据集,并且很少有学者研究补偿视频彩色信息丢失来提升识别率的问题。(ii)在实际场景中,特别是在夜间很多场合的光线较低,曝光度不足导致拍摄到的行人样本信息含量较少。目前虽然公开的一些数据集中存在光照变化的问题,但还没有公开一个标准的夜间低光照行人视频数据集。如何改善由于低光照对行人样本信息丢失造成的不利影响是行人重识别研究中一项亟待解决的任务。(iii)在实际监控中,由于不同监控设备的分辨率的差别以及与行人之间的距离远近变化等因素导致获取的行人样本分辨率不一致。高分辨率样本包含的有效信息较多,而低分辨率样本包含的有效信息相对较少。目前大多数研究主要集中在不同分辨率图像方面的识别,然而对不同分辨率视频行人重识别研究较少。(iv)在刑事侦查等社会安全应用场景中,由于目标嫌疑人的图像样本较难获取,而目击证人对嫌疑人外观特征的描述则为目标检索提供了可能。目击者的描述更多的是对目标嫌疑人的外观、衣着颜色和款式等特征粗略的刻画。虽然由这种描述来绘制的行人彩色插图风格样本包含的行人纹理等细节性的信息相对较少,但能够建立彩色插图风格的人物图片(人物插图)与真实照片之间的关联。目前针对人物插图样本与正常拍摄的行人图像之间的匹配研究相对较少。本文针对行人重识别研究中存在的以上四个方面的复杂场景下的新问题进行深入的分析与研究,并针对新问题构建了新的模型以及优化方案,在研究过程中取得了一些有价值的成果:(1)为了解决真彩色与灰度视频行人重识别问题,降低灰度视频有效信息丢失的产生的影响,本文提出了一种基于半耦合映射字典对学习的方法。该方法首先对不同摄像头中每个行人的视频样本子集分别学习一个视频内紧致投影矩阵,然后分别学习灰度字典和真彩色字典,并利用编码系数学习一个真彩色与灰度样本之间的半耦合映射以建立异质样本之间的内在关系。为保证学习到的映射和字典对具有良好的鉴别力,该方法在字典对的学习过程中设计了鉴别保真项和正则项。本文采集并发布了一个新的灰度-真彩色行人视频基准数据集,为后续研究提供了丰富的数据样本。(2)针对低光照场景下的行人重识别问题,本文提出了一种基于三元组流形鉴别距离度量学习方法。该方法首先利用测地距离将每个行人的视频序列进行划分并构建多个局部线性模型,然后学习距离度量。具体地,将每一个行人的视频序列集合看做对应的样本集,然后利用测地距离对每个样本集构建局部线性模型;利用构建的多个局部线性模型,学习距离度量矩阵使得类内距离最小以及类间距离最大,进而实现低光照场景下的行人匹配工作。为了填补低光照行人数据集的空白,本文采集并公开了一个新的低光照行人视频基准数据集。(3)为了解决低分辨率与高分辨率场景下的行人视频样本分辨率不一致的问题,本文提出了一种基于映射补偿矩阵的集对集的距离学习方法。该方法首先将视频序列划分成对应的子集提取特征,然后学习一个低分辨率到高分辨率之间的半耦合映射,最后学习一个基于集对集的鉴别度量。具体地,该方法将每个行人完整的视频序列利用步态周期的方法划分成多个视频帧序列子段,然后将视频子序列作为对应的样本子集提取特征向量;针对低分辨率导致样本有效信息的丢失问题,本文设计了一个半耦合映射矩阵来补偿样本丢失的信息,能够降低低分辨率带来的影响。该方法学习一个基于集对集的鉴别度量能够最小化类内距离,同时最大化类间距离,进而提升模型的鉴别能力。为了提供一个真实场景的低分辨率视频数据集,本文采集并发布了一个新的低分辨率与高分辨率视频行人基准数据集。(4)为了解决彩色插图风格人物图片场景下的行人重识别问题,本文提出了一种基于半耦合鉴别字典学习的方法。该方法能够对彩色人物插图样本和正常拍摄照片样本分别学习字典对,然后学习异质样本对之间的映射关系,来降低人物插图样本丢失的信息。具体地,由于人物插图样本和真实照片的样本生成的方式不同,因而两类样本具有异质性。为了解决样本异质性问题,本文提出采用半耦合技术来学习异质样本对之间的映射关系。利用学习到的半耦合映射矩阵能够降低异质样本之间的差异,进而提升行人重识别匹配准确率。为了提供一个彩色人物插图与真实照片行人数据,本文采集并绘制了一个彩色人物插图与真实照片的行人基准数据集。

其他文献

五相感应电机的直接转矩控制技术研究

文章提出一种新颖的五相感应电机直接转矩控制方案，其特点是使定子磁链及电磁转矩具有低波纹的快转矩响应的特性。与三相感应电机的直接转矩控制相比，五相感应电机有32个空间电

期刊

直接转矩控制感应电机多相电机空间电压矢量

过渡金属元素掺杂对锂—二氧化锰电池正极材料结构和电化学性能的影响

电解二氧化锰(EMD),作为工业生产中,广泛使用的一种锂-二氧化锰电池正极材料,热处理温度对其结构的和电化学性能的影响已基本研究清楚。影响其结构的另一个重要因素——时间,

学位

电解二氧化锰掺杂锂-二氧化锰电池电化学性能

美智库沙盘推演中东核战后果

拥有核武器的伊朗将会对波斯湾及中东地区乃至整个世界构成多大威胁?很多媒体都曾长篇累牍地讨论过这一问题，不过人们似乎都忘记了一个更重要的问题，那就是：如果伊朗与其它国家

报纸

Aβ1-42寡聚体和人A53T突变型α突触核蛋白在帕金森病细胞模型中的毒性影响研究

背景和目的:原发性帕金森病是一种常见的慢性中枢神经系统退行性疾病,多发于中老年人。帕金森病的主要病理特征是中脑黑质致密部多巴胺能神经元进行性变性缺失,纹状体多巴胺

学位

帕金森病α突触核蛋白Aβ1-42自噬

普及型生态—农业气象自动观测方法研究与应用

我国是一个农业大国,且气候、生态类型复杂多样,开展生态-农业气象研究既是实施农业生产的必要环节,也是深入探讨生态变化的有效途径,具有重要的理论意义和应用价值。生态-农

学位

生态气象农业气象自动观测系统研发分析方法

浓缩生长因子与DBBM混合应用于位点保存的效果研究

目的:将浓缩生长因子(concentrate growth factor)与脱蛋白牛骨矿基质(deproteinized bovine bone mineral matrix,DBBM)以不同比例混合后填充于兔拔牙窝内,探讨两者以何种比

学位

浓缩生长因子DBBM位点保存

互联网背景下儿童哮喘的管理

儿童哮喘合作单位的基线调查目的了解中国儿童哮喘管理的现状。内容与方法采用横断面问卷调查,包括78名全国儿童哮喘协作组成员和40名上海儿童哮喘协作组成员参与。结果在对

学位

儿童哮喘微信平台管理糖皮质激素身高

HPLC柱后光衍生荧光法测定中药饮片中黄曲霉毒素残留量

目的:采用免疫亲和净化HPLC柱后紫外光化学衍生荧光检测法研究中药饮片中黄曲霉毒素测定的加样回收率,考察该方法在中药饮片黄曲霉毒素残留测定中的可行性,评价120批中药饮片

期刊

黄曲霉毒素二呋喃香豆素类代谢产物中药饮片毒性成分高效液相色谱光衍生免疫亲和柱回收率安全监测

基于效用价值驱动的旅客出行动力学研究与建模

为了探究交通体系中旅客出行行为的特征与机理,以某机场离港旅客的陆侧出行数据为研究对象,对旅客出行模式进行了统计。分析发现,旅客聚集行为具有强烈的阵发性,不同出行维度

期刊

人类动力学时间间隔分布出行行为效用价值驱动换乘决策

“互联网+”时代下中华优秀传统文化传承推广策略探讨

"互联网+"思维突破了各行各业原有的形态和结构,通过"融合、创新、互联"的模式给各行各业带来机遇和无限可能,为传统行业注入活力和助力。在这样的时代背景下,中华优秀传统文

期刊

互联网中华优秀传统文化传承

复杂场景下的行人重识别关键技术研究

其他学术论文