基于局部关系的行人再识别方法研究

来源 :天津师范大学 | 被引量 : 0次 | 上传用户:wanghua8503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,行人再识别在安防监控、智能搜索等领域被广泛应用,因此得到了工业界和学术界的广泛关注。它源于视频监控的基本需求,即在多个摄像头场景下,检索特定的行人对象。然而,行人图像极易遭受行人姿态变化、异物遮挡、光照强度差异以及背景多变等因素的影响。因此,行人再识别是一项具有挑战性的工作。
  为了克服以上问题,本文使用深度神经网络搭建深度模型,提取行人图像的深度特征,捕捉局部关系的有效信息,并且提出有效的损失函数训练优化深度模型。本文主要贡献如下:
  1、为了提取行人图像的全局和多尺度局部信息,本文提出基于粗糙-精细卷积神经网络的行人再识别方法。该方法构造一个多分支神经网络从而同时学习全局特征和多尺度局部特征。对于全局特征,设计粗糙分支提取整个行人图像的全局特征。同时,设计精细分支学习行人图像不同区域的多尺度局部特征。最后,将全局特征和多尺度局部特征进行串联得到行人图像的最终特征表示。
  2、为了同时学习类间-局部关系和类内-局部关系,本文提出基于部件引导图卷积网络的行人再识别方法。该方法构造类间-局部图和类内-局部图分别学习类间-局部关系和类内-局部关系。对于类间-局部关系,从行人图像的对应区域提取局部特征作为节点构造类间-局部图,计算节点间的相似度,得到邻接矩阵,从而聚合不同行人图像对应区域的局部特征。对于类内-局部关系,从同一行人图像的不同区域提取局部特征作为节点构造类内-局部图。同时,设计部分动态机制优化算法,进而精准地优化邻接矩阵,聚合同一行人图像的不同区域的局部特征。最后,将得到的对应同一区域聚合后的局部特征串联,得到行人图像的最终特征表示。
  3、为了区分行人图像不同区域的重要性,本文提出基于异构局部图注意力网络的行人再识别方法。该方法构造一个完备局部图用于同时学习类间-局部关系和类内-局部关系,利用注意力机制计算注意力权重,并且聚合不同区域的局部特征得到行人图像的最终特征表示。对于类间-局部关系,设计类间-局部边线用于连接不同行人图像的对应区域和邻接区域,提出了注意力正则化损失函数约束类间-局部关系的注意力权重。对于类内-局部关系,设计类内-局部边线用于连接同一行人图像的不同区域,并提出在类内-局部关系的注意力权重中注入上下文信息,增强特征表示能力。
  本文探索了行人图像不同区域之间的局部关系,将局部信息嵌入到局部特征学习中,强化了局部特征表示能力,在四个公开的大规模行人再识别数据集上取得了较好的实验结果,证明了提出方法的有效性。
其他文献
随着海洋领域的大力发展,声隐身性对于海上工作有着至关重要的作用。开展水下声源定位研究,确定水下声源所处空间的分布情况,研究不同类型声源对水下平台的影响,是进行减振降噪的一个重要过程。随着减振降噪技术的不断发展,水下平台自身辐射的噪声水平越来越低,若仍使用在远场条件下对水下声源的分析方法已经不能准确地获得声源位置信息。相较于窄带声源,宽带声源可以携带更多信息。因此,研究宽带声源的定位方法具有特别重要
学位
随着指纹识别技术在国内外快速发展并被各个领域所应用,人们对指纹识别系统性能的要求也愈来愈高。虽然指纹识别系统已相对成熟,但现有的提取指纹方向场的算法仍然存在问题,指纹图像在曲线角度特别陡的区域方向信息不连续以及没有办法进行准确平滑,在脊线中存在一些空洞或者在谷线上有不定数量的斑点情况下,对于离散类指纹图像无法起到很好的提取效果。本文为解决上述问题,提出一种改进的指纹方向场提取算法。本文根据干涉图样
学位
图像配准不仅是图像融合和三维重建中非常重要的中间步骤,同时也在遥感图像和医学影像领域中受到越来越多的关注。因此,对图像配准的方法进行研究具有重要的理论价值以及现实意义。在传统方法使用整幅图像进行配准时,引入无关区域的干扰,并且特征点匹配存在精度不足的现象,为此本文提出基于Faster RCNN的图像配准算法。本文通过改进的Faster RCNN神经网络对参考图像和浮动图像进行感兴趣区域提取,减少了
学位
森林火灾破坏性大,严重威胁森林的安全。传统的森林火灾检测方法主要是通过各种传感器对区域内温度、光谱、烟雾颗粒、可燃气体含量等指标进行检测,然而,这些感应设备存在信息量损失大、稳定性较差和实时信息无法存储等缺陷。而基于图像处理技术的森林火灾探测技术可以有效弥补传统探测方式的弊端,实现对森林火灾的实时监测。  本文针对森林火灾图像识别问题,在深入研究林火图像特点的基础上,采用脉冲耦合神经网络(PCNN
学位
野外火灾的发生,每年都会造成巨大的经济损失甚至危害人类的生命安全。由于野外森林面积大,环境干扰强,导致与传感器相关的火灾检测技术具有成本高、检测范围有限以及易老化等缺点,因此并不适用于野外火灾检测的场景。然而,随着视频监控技术的发展和相关技术的普及,针对野外火灾检测的研究逐渐开始向视频检测和识别的方向发展,这使得动态烟雾检测技术具有重要的研究意义。为了尽可能的扩大野外监控视角及范围,监控获取的须是
随着人工智能的快速发展,像人机交互、语音识别等这些需要语音参与的场景都离不开语音增强这种前端技术的支持。除此之外,复杂噪声场景下的语音信号如何在有效去除噪声的前提下同时提高语音的质量,从而符合人耳的听觉特性,这正是语音增强所需要探讨的核心内容。现有的语音增强算法在弱背景噪声下能够取得较好的效果,但是随着噪声环境的改变,比如复杂场景的切换和输入信噪比的急剧下降,如何使得语音增强算法能够平衡去噪效果和
学位
近年来随着人们不规律的生活饮食习惯,人们长期处于亚健康状态,导致了心脑血管疾病的突发几率也逐渐增加。为此本论文设计了一个通过实时检测人体生物信息并且将采集到的数据通过蓝牙模块传输到移动手机端,手机端经过预处理将数据发送至服务器的系统。在服务器端对信息进行处理,进而用来预测心血管系统健康风险,保证心血管系统的健康。本论文给出了基于脉搏波和六轴姿态传感器的人体生物信息实时监测系统,主要包括脉搏波采集、
学位
图像分割技术是各种医学图像应用的基础,分割质量的好坏直接影响图像处理的后续步骤。近些年来,随着计算机技术的快速发展,医学图像的成像方式更为丰富,提供的信息量也越来越多,为临床医学提供了巨大价值。Otsu阈值法是图像分割方法中最简单、直接、快速的分割方法,具有原理简单、易实现的优良特性。但是对于复杂图像,获取阈值的速度以及阈值质量都受到了限制,因此医学图像的阈值分割应用依然很少。为了提升医学图像阈值
眼底血管的自动分割对缩短糖尿病视网膜病变的诊断周期具有重要意义。人体眼部组织结构复杂且眼底图像在采集过程中因光照不均易混入噪声,导致现有的分割算法对血管的分割精度不高。为了解决这个问题,本文采用改进水平集的血管分割算法对眼底图像进行处理,处理过程分为预处理、血管增强和血管分割三个阶段。1.针对眼底图像存在噪声和视盘干扰的问题,对图像进行预处理。选取绿色通道图像作为待处理图像,通过灰度校正和同态滤波
学位
随着人工智能技术的不断发展,卷积网络语义分割方法逐渐进入人们的视野。相比于传统的图像处理手段,卷积网络不仅提高了性能,而且缩减了特征标注的人力。随着大数据时代的到来,海量的图像数据要求快速、准确的分割并识别图像的种类。图像的语义分割是对图像中每个像素点进行分类,并依据每个像素点的类别,用不同颜色描绘一幅分割图。图像的语义分割和目标检测在自动驾驶、医学、自动监控等领域有着广泛的应用。  本文研究了高
学位