【摘 要】
:
行人重识别是判断视频或图库中是否存在特定行人的技术。由于在监控和安全方面的广泛应用,例如公共安全的视频监控和行人检索、人机交互以及生物识别中的访问控制,使得行人重识别受到学术界的广泛关注。然而真实场景中,行人重识别存在相似着装、光照强度、姿态、视角变化以及遮挡等挑战,增加了行人重识别任务的难度。行人重识别主要任务在于如何从行人图像中提取具有辨识性且丰富的行人图像特征,对行人特征进行度量,进而判断是
论文部分内容阅读
行人重识别是判断视频或图库中是否存在特定行人的技术。由于在监控和安全方面的广泛应用,例如公共安全的视频监控和行人检索、人机交互以及生物识别中的访问控制,使得行人重识别受到学术界的广泛关注。然而真实场景中,行人重识别存在相似着装、光照强度、姿态、视角变化以及遮挡等挑战,增加了行人重识别任务的难度。行人重识别主要任务在于如何从行人图像中提取具有辨识性且丰富的行人图像特征,对行人特征进行度量,进而判断是否为同一个行人。为提取鲁棒且丰富的特征,提高算法性能,本文主要研究内容如下:针对模型可能出现过拟合或模型收敛慢等问题,引入5种训练技巧训练行人重识别模型。利用基准网络ResNet50-IBN-a分析不同训练技巧对性能的影响,并用合适的训练技巧优化基准网络。针对背景中无用信息的干扰,以及模型在尺度变化、遮挡、模糊等场景下无区别特征导致行人重识别网络中的性能问题,在优化基准网络基础上,提出一种基于双重注意力机制的行人重识别算法CS-Attention(Channel and Spatial Attention)。该模型可以整合身体区域关键的属性信息到一个统一的学习网络框架中,获取更多具有辨别性的特征,避免由于行人图像背景等干扰影响网络过度关注无用信息的问题。CS-Attention由通道域注意力机制(Channel Attention)和空间域注意力机制(Spatial Attention)组成,在基本不增加计算量的情况下,从通道和空间两方面限制网络,使网络更加关注鲁棒的特征,弱化无用的干扰特征,提高模型性能。针对高级特征提取利用不足问题,设计多分支混合池策略MBP(Multi Branch Pooling)。由于高级特征对识别行人具有关键作用,为获取丰富的高级特征,提高行人识别的性能,将MBP策略引入模型中,构成CS-MBP模型。MBP策略是通过平均池化和最大池化手段保留更多高级特征,将其进行融合训练整个网络,增加了特征的多样性。在模型的训练过程中,使用难样本采样三元组损失(Tri Hard Loss)和交叉熵损失函数(ID Loss)共同约束模型的学习参数。Tri Hard Loss使特征空间中的原始位置不会因损失函数而改变,确保该层的优化不会对深层的网络层产生负面影响,有效地优化池化层的输出,同时加快网络的收敛。ID损失有助于了解不同场景中的代表性特征,表达相同个体的共同特征。实验结果表明,本文使用的训练技巧可以从不同方面对基准模型进行优化。在优化的基准网络基础上引入CS-Attention,有效改善无关信息干扰,提取更加有区分性的特征。最后联合提出的多分支池化策略MBP构造CS-MBP模型,实现对高级特征最大化的利用。本文在行人重识别主流数据集上进行大量实验,在Market1501数据集上,优化后的基准模型、引入CS-Attention模型以及CS-MBP模型的Rank-1分别为:94.8%、95.8%和96.2%,m AP分别为:86%、87.6%和88.3%,最终的CS-MBP较优化后的基准模型在两个指标上分别提升1.4%和2.3%。Duke MTMC-reID数据集上,以上三个模型的Rank-1分别为:86.8%、89.1%和89.6%,m AP分别为:76.1%、78.8%和79.6%,最终的CS-MBP较优化后的基准模型在两个指标上分别提升2.8%和3.5%。证明了本文所提出算法的有效性,有利于行人重识别领域的发展。
其他文献
近年来,随着我国汽车保有量逐年增加,充分利用高新技术解决交通问题的智能交通系统受到越来越广泛的关注。道路车辆目标的精准识别作为智能交通系统的重要功能之一,其实现过程可以看作是在道路视频图像中完成对特定车辆的目标匹配。道路目标车辆准确、稳定、实时、快速的检测和匹配对智能交通系统来说至关重要。本文所提出的车辆检测与特定车辆目标匹配方法主要致力于对交通场景下道路上的车辆目标进行有效检测并对所期望识别的如
合理构建初始模型是当前大地电磁三维反演实用化中迫切需要解决的难题。然而,传统初始模型构建方法存在费时和不客观的缺点,造成反演解释的困难。为此,我们提出基于一维反演结果引导的初始模型构建方案,通过对不同数据集的一维反演结果进行三线性插值,并提取全区最小Bostick深度的相似信息以构建三维反演的初始模型,进而更好地恢复地下结构。利用该方案对一系列理论数据进行反演试算,结果表明基于一维反演结果构建初始
随着海洋活动的迅速发展,各种计算密集型应用呈现蓬勃增长的态势,这对于海上通信网络的要求不断提高。目前的海上通信网络无法满足大数据、高速、低成本的无线通信需求,对传统海上通信网络进行智能化融合是海上网络建设的必然选择。以此为初衷,本文开展了对海上通信网络的研究。本文引入移动边缘计算(Mobile edge computing,简称MEC)技术对现有海上通信架构进行拓展,为资源稀缺或延时敏感的海上终端
随着第五代移动网络(5G,5th Generation Mobile Communication Technology)时代的到来和智能终端的快速更新,为了满足海量连接和多样化实时业务的需求,越来越多的设备参与到无线传感器网络的构建当中。发光二极管(LED,Light Emitting Diode)作为一种新型照明设备逐渐取代了传统白炽灯和荧光灯。与此同时,以LED为基础设施的可见光通信(VLC,
随着越来越多智能通信终端的不断涌现和通信技术的快速发展,与近距离通信服务有关的用户需求也在不断攀升。面对这些日益增长的高传输速率要求的业务,在提升用户服务体验的同时,还要减少运行成本,因此设备到设备(Device-to-Device,D2D)通信技术被列为蜂窝移动通信的关键技术之一。设备到设备通信是一种新的通信模式,它支持距离较近的用户间直接进行数据传输,将D2D通信技术与蜂窝网络结合起来,优势在
目的:研究小儿哮喘并发反复呼吸道感染(RRTI)采取玉屏风散联合穴位贴敷治疗的疗效及对免疫功能和炎症因子的影响。方法:回顾性分析2021年12月17日至2022年9月17日内黄县人民医院儿科收治的122例哮喘并发RRTI患儿的临床资料,按随机数字表法分为对照组和观察组,各61例。其中对照组患儿实施常规西药治疗,观察组患儿在对照组的基础上采取玉屏风散联合穴位贴敷治疗,比较两组患儿的治疗效果、炎症因子
车载驾驶辅助系统是通过安装在汽车上的多种传感装置,在驾驶过程中感知周围环境动态信息,进行静、动态物体的辨识、侦测与追踪等技术上的处理,从而能够让驾驶者提早察觉安全隐患的主动安全技术。随着汽车信息化智能化的不断发展,车载驾驶辅助系统已经成为保障车辆驾驶安全中的重要环节,与此同时,系统受到的复杂电磁环境干扰问题也在日益显著。一方面车辆内部越来越多的电子设备对车载驾驶辅助系统的干扰情况愈发严重,另一方面
抖音作为中国头部短视频平台,在旅游类短视频传播方面具有巨大优势,通过优质的短视频内容、紧抓热点推广、算法推荐机制等多重组合助推旅游宣传,促进了旅游业的发展。旅游类短视频爆火背后也出现视频内容与实景不符、景区管理不善、人流积压等问题。管理部门应加强线上线下结合管理,网络管理部门和当地管理部门协同治理;景区应吸纳游客意见,加强互动管理,提升自身口碑;平台要做好全流程监控,创作者提高自身素养;用户应提升
在沙漠地震勘探过程中,由于地表条件和采集环境复杂,采集到的地震记录中往往伴随着大量的随机噪声。这些噪声降低了地震数据的信噪比,是影响地震数据质量的关键因素,给地质结构的解释带来了挑战。研究沙漠地震勘探随机噪声的产生机制和传播过程有助于深入认识和刻画随机噪声的复杂性质,为进一步的利用随机噪声性质改进地震数据处理技术提供理论支撑。沙漠地震勘探随机噪声主要是由勘探过程中的自然外力或者人类活动等因素产生的
鬼成像也叫关联成像,是基于光场强度二阶关联测量的成像方式,是一种前景广阔的光学成像技术,它的优势是在于:在可见光波段和不可见光波段都可以实现成像;同时可以突破经典衍射极限,弥补传统光学成像的不足。虽然现行的大多数算法对静止物体进行鬼成像可获得高质量的成像效果。但是随着对移动物体的鬼成像研究的不断深入,移动物体鬼成像的成像速度慢和成像质量差的问题依旧没有得到很好的解决。为解决这一现实问题,本文提出了