基于深度学习的遮挡式行人重识别

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:haikong123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是计算机视觉中的一项重要任务,其目的是为了检索存在于图像或者视频中的特定行人。近年来,随着深度学习的发展,行人重识别研究也取得了许多突破,并且在安防和刑侦等多个领域取得了广泛的应用。目前,传统的行人重识别方法大多致力于提取丰富的图像特征。但是,当面对实际场景下常见的遮挡问题时,它们的识别精度都会出现大幅下降。根据遮挡情况的严重程度,本文将遮挡式行人重识别分为局部遮挡和部分遮挡两种。本文基于深度学习,针对遮挡式行人重识别任务进行了研究,主要创新点如下:(1)针对行人重识别基准网络大多数精度不够高的问题,本文提出了简单高效的行人重识别基准网络。考虑到基准网络结构的简洁性,该基准网络仅使用一个全局特征,损失函数为一个三元组损失和一个分类损失。本文采用六种策略训练和优化行人重识别基准网络,包括预热学习率、随机擦除增广、标签平滑、扩大特征图、批量归一化网络和注意力机制,在几乎不增加网络参数量的前提下,进一步提升该基准网络的精度,并通过消融实验分析上述六种策略对基准网络精度和复杂度的影响。实验表明,本文提出的基准网络在几乎不增加参数量的情况下,其识别精度超越了目前绝大多数的基准网络。该基准网络被用作以下两个解决局部遮挡和部分遮挡的模型的基准网络。(2)针对遮挡式行人重识别中的局部遮挡问题,本文提出了基于三元组擦除的数据增强方法。该方法的核心思想是向训练集引入更多新的被局部遮挡的样本,提高模型对于局部遮挡的鲁棒性。该方法包含局部距离分支和三元组擦除分支,局部距离分支主要功能是对齐两张行人图像的局部特征,三元组擦除分支的主要功能是擦除三元组图像中的某块矩形区域来创造更难判别的正负样本对,这可以增加训练难度,从而提高模型的判别能力。因为该方法本身属于数据预处理阶段的操作,所以适用于其他使用三元组损失的行人重识别网络。(3)针对遮挡式行人重识别中的部分遮挡问题,本文提出了基于注意力机制的特征对齐网络。与传统方法使用额外的人体姿态估计模型或者行人分割模型来提取人体语义信息不同,本文提出的网络仅使用无参数增加的空间注意力来使模型更加关注图像的显著性区域。此外,在检索阶段,本文创新地使用空间注意力来对齐两张图像的共享可视人体区域,降低大面积障碍物对于模型的干扰,从而提高模型对于部分遮挡的鲁棒性。
其他文献
在我国基础设施建设不断发展的今天,公路建设作为基础建设中重要的环节之一,也得到了飞速的发展,但伴随而来的道路养护问题。道路养护的首要环节是检测路面损坏,其中,道路裂缝是在路面检测过程中最为常见的路面病害类型之一。论文以道路裂缝作为研究内容,采用深度学习的语义分割算法来检测道路裂缝,围绕路面裂缝图像的预处理、裂缝检测算法以及裂缝的定量分析展开研究。首先,对采集到的裂缝图像进行滤波操作,同时结合裂缝图
车辆检测和车型识别是智能交通领域中的重要研究内容。随着人工智能技术的发展,在智能交通领域运用深度学习解决车辆检测和车型识别问题已经成为一种研究趋势。本文基于深度学习方法对车辆检测和车型识别进行了研究,主要研究内容如下:(1)针对目前车辆检测数据库较少的问题,本文选择南京信息工程大学周围的交通环境作为研究背景,从样本的拍摄采集、正负样本及模糊样本的筛选和标签标注等方面详细介绍了本文构建的车辆检测数据
随着智能设备的广泛运用,包含用户信息的数据不断涌现,基于大数据的人工智能技术有了质的飞跃。但是机遇与挑战并存,人工智能技术利用数据为各行各业带来增益的同时,用户隐私数据泄露的问题也随之出现。因此联邦学习应运而生,这是一种特殊的分布式机器学习框架,它能够联合多客户端训练的同时保护数据隐私,因为客户端的数据不需要离开本地。这样的学习框架为人工智能技术面临的挑战提供了解决方案。本文针对现有联邦学习的缺点
多人姿态估计任务可以概括为两个阶段,第一阶段将输入图像中人体检测出来(人体检测),第二阶段基于第一阶段检测出来的各个人体,进一步将其骨骼关键点位置定位出来(单人姿态估计)。多人姿态估计在人机交互、电影制作和安全监控等领域有巨大的应用背景。在技术方面,轻量化是深度学习多人姿态估计中近年来的研究热点之一。本文对深度学习多人姿态估计的轻量化方法进行了探索和研究,主要研究工作包括:针对单人姿态估计中目前最
随着我国汽车保有量的逐年攀升,私家车通勤在日常出行中的所占比重越来越大。上路车辆的增多带来了许多交通问题,而通勤时段的拥堵问题尤其突出。目前推行的尾号限行、拥堵收费的方式未能充分考虑通勤者的临时出行需求。合乘出行正是缓解通勤时段交通压力和有效利用资源的良策,也是许多出行者倾向的选择。网约拼车近年来得到快速发展,但现有互联网打车平台未能摆脱以盈利为目标的营运性质,利益驱动下的上路汽车只会增多。本文结
目前,随着“海洋牧场”的快速建设和海洋资源的深入探索,水下机器人(Unmanned Underwater Vehicle,UUV)正广泛运用于海洋矿产、渔业等资源的开发。针对水下机器人小型化、大众化过程中出现的操作难、易受干扰、易损坏等问题,本文以自主设计的“Aquaman V3”小型水下机器人为基础,通过优化硬件和控制算法,提高小型水下机器人的稳定性与控制精度,使之能够对抗海流、碰撞等外界扰动,
我国海洋资源丰富,但并未得到充分的开发,相较于河流、湖泊等水域,海洋的水下环境更加复杂和危险,人工进行探索和开发的危险系数过高。水下机器人成为了人类对海洋探索的重要工具,而视觉图像在水下机器人探索与感知周围环境时扮演着重要的角色。由于水体的吸收和散射,水下图像具有对比度低、图像模糊、色偏等问题,影响水下机器人后续的视觉任务。因此,获取高质量的水下图像对人类探索开发海洋有着十分重要的意义。本文根据水
近年来,由于多智能体系统包含控制在航空、工业、运输等领域的广泛应用,引起许多专家学者的关注。多智能体系统包含控制可以看作一致性和编队问题的特殊情形,是指通过设计包含控制算法,驱使一组跟随者在多个领导者的引领下,最终进入并保持在由领导者所形成的凸包中运动。与传统多智能体系统问题相比,包含控制更能突出分布式协同控制的优势。针对系统收敛速度、智能体状态不可知以及信息传递过程中出现时滞、外界扰动、Do S
气候变化带来的影响是方方面面的,并且人们常采取手段对负面的影响进行干预。近年来,人们对于降雨的预测需求越来越多,传统的降雨预测手段需要收集大量的物理信息,增加了复杂度,并且过于规律的预测手段会导致预测不精准。随着深度学习的发展,图像处理在许多任务上取得成效。本文提出利用图像序列预测任务的方法来处理降雨预测任务,取得了令人满意的效果。图像序列预测即给定若干张连续图片,预测后续一张或若干张连续图片的时
六轴工业机器人在现代制造业中有着广泛的应用,是工业机器人的典型代表。为解决六轴工业机器人示教耗时费力和无法适应变化的作业场景等问题,使机器人能够在复杂的环境中实现自主规划,本文以IRB 120机器人为对象,研究了六轴工业机器人的运动规划问题,包括机器人运动学、轨迹规划、碰撞检测和避障路径规划,主要内容如下:首先,对机器人的运动学进行了求解。利用D-H法对机器人进行运动学建模,通过齐次变换得到了机器