【摘 要】
:
行人重识别是在多个不重叠摄像头下检索感兴趣行人的关键技术,在智慧城市、智能安防、智慧商场等系统建设中都有着重要的需求。相较于传统的手工设计特征的行人重识别方法,基于深度学习的行人重识别方法在识别精度上更具优势。基于图片行人重识别对于图像质量要求较高,同时由于单帧行人图像可利用信息有限,无法很好地解决遮挡问题,而基于视频的行人重识别能够利用多帧图片的信息,可以弥补单帧行人图像信息不足的缺点。然而现有
【基金项目】
:
国家重点研发计划项目(编号: 2020YFC1522600);
论文部分内容阅读
行人重识别是在多个不重叠摄像头下检索感兴趣行人的关键技术,在智慧城市、智能安防、智慧商场等系统建设中都有着重要的需求。相较于传统的手工设计特征的行人重识别方法,基于深度学习的行人重识别方法在识别精度上更具优势。基于图片行人重识别对于图像质量要求较高,同时由于单帧行人图像可利用信息有限,无法很好地解决遮挡问题,而基于视频的行人重识别能够利用多帧图片的信息,可以弥补单帧行人图像信息不足的缺点。然而现有的视频行人重识别数据集规模较小,深度学习的方法又极度依赖数据,因而在小数据集上训练的深度模型普遍存在过拟合问题,且行人图像序列相比于单帧图像,不仅包含空间信息,还蕴含着时序信息,以上因素影响了视频行人重识别识别精度的提升。因此,本文的研究内容主要包括以下两点:(1)针对小数据集在深度模型上训练时的过拟合,本文设计了一种基于姿态生成图像序列的行人数据增强方法。该方法使用渐进式姿态迁移生成对抗网络,用于生成行人图像序列,并将由生成的行人图像序列所构成的生成数据集,与原数据集共同训练视频行人重识别模型,训练过程中采用标签平滑正则化的策略。在两个公开的行人重识别数据集PRID2011和i LIDS-VID上,实验结果表明该方法在行人重识别基线模型上,Rank-1分别提升了4.5%和3.3%,m AP分别提升了2.2%和1.2%。(2)针对如何更好地利用图像序列的空间信息和时序信息,以获得更具鉴别力的序列特征表达,本文设计了一种基于通道注意力和多尺度时间关系推理的视频行人重识别模型,该模型结合了基于通道注意力机制的网络SE-Res Net,基于多尺度时间关系推理的时序注意力模型以及BNNeck结构。为了提取行人图像中更有价值的空间内容,该方法引入了通道注意力机制,使用通道注意力网络模型SE-Res Net作为特征提取的骨干网络。为了利用图像序列中的时序信息,该方法引入了多尺度时间关系推理模块,多尺度时间关系推理模块是一种多尺度的时序注意力模型,能够通过时间关系推理,从图像序列中挑选出更具鉴别力的帧,对其赋予更大的权重。整个网络将多尺度时间关系推理模块得到的权值与SE-Res Net提取的帧级特征,通过加权平均获得代表该序列的特征表达。网络采用交叉熵损失和三元组损失联合训练,为了缓解两种不同类型的损失训练时优化目标不一致的现象,引入了BNNeck结构用于优化两种损失的收敛。在两个公开的行人重识别数据集PRID2011和i LIDS-VID上,实验结果表明该方法的Rank-1准确率分别达到了92.1%和83.3%,同时该算法模型的复杂度和参数量都比较适中,综合考量下能够说明该算法模型的有效性。更进一步地,在结合(1)中方法对原始数据进行增强时,Rank-1准确率相较于原来的基础上再次分别提升了0.3%和0.7%。
其他文献
根据中高层大气探测激光雷达台站的现状,研发了一套智能化的激光雷达综合控制软件系统。该系统将激光雷达的天窗、水冷机、激光器、光电倍增管等部件有机地组合在一起,严格按照激光雷达的操作规范实现了自动化控制;并在运行过程中实时监测气象条件和激光雷达各部件的运行状况,如遇突发异常,按规范进行应急处理;该系统既能通过实验室内的计算机操作终端实现整体系统的操作与监控,又能通过手机端实现远程的操作与监控。具体工作
作为一种高效信道编码,LDPC码(Low Density Parity Check Code)具有良好的纠错性能,其置信传播(BP)译码具有低复杂度优点,在通信领域得到了广泛应用。但是,在其Tanner图中,存在陷阱集问题,导致BP译码算法在译码过程中的性能曲线在高信噪比的区域出现平台状现象,即称为错误平台(error floor)现象,这一现象的出现使其在低误码率存储等领域中的应用受到限制。本文
人脸图像超分辨率旨在通过数值计算的方法,对获取的低分辨率、低质量人脸图像进行分辨率增强,从而有效改进人脸图像的视觉质量及其辨识性,在基于监控视频的人脸识别等领域具有重要应用价值。由于人脸图像具有高度结构化和特有的身份属性,人脸超分辨率如何恢复出含有精细细节且身份保留的人脸图像是极具挑战性的课题。近年来,基于深度学习的人脸超分辨率方法引起了极大关注,相对于传统方法展现了明显优势。为了补偿图像降质过程
随着各种移动终端以及互联网的快速发展和普及,越来越多的人通过移动终端的各种APP以视频的方式获取信息,与此同时,各种信息安全问题也随之而出。盗版影视,私密视频在网络上肆意传播,各种版权以及信息安全问题的解决迫在眉睫。针对这些问题,视频水印技术应运而出,成为一种解决版权问题保护信息安全的有效手段。视频水印技术通过将版权信息嵌入视频中,并在网络上传播后,依然可以从视频中提出版权信息来证明视频的所属权,
多目标跟踪(Multi-Object Tracking,MOT)是计算机视觉领域的一个重要研究内容,其任务是确定视频序列中所有实例的运动轨迹。作为计算机视觉中的一项基础研究,已广泛应用于自动驾驶、智能监控、人机交互等领域。近年来,由于深度学习技术的发展,多目标跟踪的研究工作取得了很大的进展;然而受跟踪目标数量的不确定、目标间的相互遮挡、复杂背景干扰以及检测器漂移等因素的影响,多目标跟踪仍然面临很大
由于城市的迅速发展,城市道路变化日新月异,道路的安全成为城市发展的焦点,近几年全国各地道路塌陷事故频发,成为威胁人民生命财产安全的重大隐患,能否及时探测道路下方异常地质区域,成为预防道路塌陷事故的关键手段。常用于道路探测领域的仪器有探地雷达、高密度电法仪、地震波探测仪等。由于城市道路地质复杂性多变,探地雷达探测深度较浅,达不到城市地下空间建设的深度探测要求,而高密度电法仪需要向地面打入探测电极,因
以萱草为供试对象,研究肥药结合对萱草叶枯病病情指数的影响。结果表明,无论是老叶,还是新生叶,其叶枯病病情指数随着处理后时间延长而上升,表现出明显的时间效应;农药与肥料混合处理能够显著降低叶枯病病情指数。与对照相比,多菌灵和复合肥各组合处理下,叶枯病老叶病情指数显著下降27.80%、 39.35%、 48.96%及37.53%。与对照相比,多菌灵分别与复合肥0、 240、 320kg/hm~2水平组
深度学习(Deep Learning,DL)在计算机视觉、语音信号处理、金融等领域取得了重大突破。但与统计学习方法相比,DL中的深度神经网络(Deep Neural Networks,DNN)存在鲁棒性不足的问题,即:在输入信号中加入精心设计的微小扰动干扰后,产生的对抗样本可导致网络输出错误的判决结果。许多学者探讨了将DL引入无线通信系统设计,相比传统的基于统计模型设计的系统提升了性能。但无线通信
以10个不同品种的萱草花为原料,采用超声辅助法提取萱草花中黄酮、多酚及多糖,并评价3种提取物的抗氧化活性。结果表明,10种萱草花中多糖最高得率8.29%;多酚最高得率1.521%;黄酮最高得率1.743%。抗氧化活性结果表明,10种萱草花的提取液对1,1-二苯基-2-三硝基苯肼(DPPH)自由基、2,2′-联氮-双-3-乙基苯并噻唑啉-6-磺酸(ABTS)自由基均具有较好的清除率,其中‘牧羊人’品
为提高环氧树脂灌封材料对金属材质的粘接性能,研究了分子结构、胺类固化剂种类和无机粉体对环氧树脂灌封材料拉伸剪切强度的影响。结果表明:采用聚氨酯改性环氧树脂和二聚酸改性环氧树脂制得的环氧材料拉伸剪切强度更高。聚酰胺、聚醚胺和芳香胺3种胺类固化剂制备得到的材料拉伸剪切强度依次降低。随着无机粉体填充量的增加,环氧材料的拉伸剪切强度先增大后减小。对于纳米级粉体气相SiO2,其填充质量分数为4%时环氧材料就