基于深度学习的行人重识别算法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:mesnower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对海量的城市监控视频数据,通过智能分析代替人工查看的方式在安防领域已得到大量研究学者的关注。行人重识别作为监控视频内容分析的核心,得到了迅速的发展。其目的是解决跨摄像头后,通过行人的外观视觉特征和动作特征在海量的图像或视频库中检索特定行人的问题。对相互联网的不同摄像头拍摄到的行人身份进行关联,以便及时获取特定行人的运动轨迹。现实生活中由于监控环境复杂多变,摄像头安置位置各异以及光照强弱不同等影响因素,使得同一行人在不同摄像头下捕获的图像不一致,加大了行人重识别难度。针对不同场景下影响因素对行人重识别精度的影响,本文以卷积神经网络为核心,提出两种可有效提升重识别精度的网络模型。主要研究内容如下:1)针对摄像头捕获的行人图像中存在的噪声、行人之间部分遮挡以及动作姿态多变对重识别的影响,提出了一种基于时空注意力机制的行人重识别算法。首先采用Res2Net-50提取多尺度行人特征,同时采用注意力机制对基础骨干网络提取的原始特征图中未被激活或错误激活的部分区域进行重新标定筛选,以提取更具区分力的行人特征。其次采用3D聚合模块对重新筛选后的帧级行人特征进行聚合,以充分利用视频序列中的时空信息,获得最后代表整个视频序列的具有鲁棒性的行人特征向量。经过在i LIDS-VID、PRID-2011以及MARS三个数据集上进行大量消融实验,rank-1分别达到85.5%、92.7%以及85.6%,优于目前大多数方法。2)针对视频序列中存在的时空依赖以及行人特征图比较时出现的空间错位问题,提出了一种基于非局部3D密集卷积神经网络的行人重识别算法。首先采用3D密集卷积神经网络代替2D卷积操作,同时提取时空维度特征,充分挖掘输入样本序列中隐藏的时空信息。其次为了有效捕获视频序列中远距离的时空依赖,同时解决行人特征图之间空间未对齐使得重识别准确率降低的问题,在3D密集卷积块中加入非局部块,通过非局部操作计算特征图中任意两个空间位置存在的相互关系进而对特征图中存在的远距离依赖进行捕获,同时解决空间错位问题。经过在i LIDS-VID和MARS两个数据集进行多组消融实验,rank-1分别达到84.3%和87.8%,证明该方法具有优异的性能表现。
其他文献
超连续谱具有光谱范围宽、功率高和低相干性的特点,非常适合应用于光学相干断层扫描系统。而1.6μm波段的激光位于水吸收和散射谱的低谷位置,能够有效降低水吸收和散射损耗,可作为光学相干断层扫描系统的理想光源。因此,本论文在1.6μm锁模光纤激光器基础上结合非线性效应探讨了1.6μm波段超连续谱的产生,并将超连续谱应用在光学相干层析扫描技术中。具体研究内容如下:1.设计基于非线性偏振旋转(NPR)锁模机
为了实现GaAs基量子阱半导体激光器更宽的光谱范围,InGaAs/GaAs应变量子阱被广泛应用在量子阱激光器中。同时,应变多量子阱可以实现更高的材料增益,但随之而来的应变积累会引发晶格错配,并出现层-层生长模式向层-岛生长模式转变等问题,给外延生长带来一定难度。与传统无应变GaAs势垒相比,GaAsP势垒作为一种拉伸应变材料,可在InGaAs量子阱结构中减小应变积累,增加临界厚度。并且在量子阱激光
背景:迁移赔补与日俱增,风险凸显rn运营商网络资产迁移赔补业务主要指因城镇道路、市政设施新增改建导致通信设施迁改、维修或损坏,政府部门、独立法人机构或个人等主体给予电信企业的赔偿或补偿.rn近年来,城市基建不断加强,轨道交通与高速公路铺展开来.运营商面临着日益增长的网络资产迁移及较大规模的补偿款.据统计,某省电信公司2013年至今产生迁移赔补合同8000余份,合同金额约40亿元;其中,某地铁线通信管线改造项目跨期3年.由此可见,运营商迁改业务存在数量多、金额大、周期长等特征.
期刊
随着我国大型装备制造业的快速发展,在航空航天、汽车制造、船舶等领域对大尺寸对象的测量需求越来越多,高效率、高精度的大尺寸测量技术是我国研究人员不懈追求的目标。传统的测量技术由于测量范围有限、操作复杂等因素,不能较好的保证大尺寸测量对象的测量精度及测量效率。本文针对大尺寸对象单系统站位测量效率低下、视觉测量需要布设大量合作靶标、全局扫描精度低等问题开展了面向大尺寸对象的组网式视觉跟踪扫描技术研究,对
语音作为信息交互的媒介,相较于其它的交互方式,其表达更直观简洁。通过语音交互传递信息更加自然、灵活且传递效率更高。在现实生活中,语音的采集和识别系统的性能与接收到的目标音频的质量有关,然而语音信号在编码、传输过程中无法避免与噪声产生混杂,导致语音采集和识别的结果较差。通常使用语音增强技术来处理带噪语音信号是为了抑制噪声对语音产生的影响。大多数语音增强算法为了降低算法的复杂度,对不同类型的噪声采取相
科技的飞速发展总是让生活在21世纪的我们感到应接不暇,但又必须深刻地认识到“科学源于生活,并在以惊人的速度改变着生活,创造着崭新的历史,带领着我们向着更加美好的方向前行”.生命科学作为与我们息息相关的科学更是如此,甚至有人称“21世纪是生命科学的世纪”.
期刊