【摘 要】
:
随着计算机运算能力的提升和深度学习技术的迅速发展,基于深度学习的行人重识别方法相较于传统行人重识别方法在识别精度上有了很大的提升。然而,基于深度学习的行人重识别方法通常采用深度卷积网络作为行人特征提取骨干网络,利用高维特征表示行人,这引入了大量的参数量和计算量。本文主要研究内容是设计轻量的行人特征提取骨干网络、轻量的行人特征对齐模块和高效的散列层,可以快速且准确地进行行人重识别。具体工作内容如下:
【基金项目】
:
国家自然科学基金创新研究群体基金(61621005); 国家自然科学基金重点项目(61836009); 国家自然科学基金重大研究计划(91438201、91438103、91838303); 国防科技173计划项目; 国家自然科学基金(U1701267、62076
论文部分内容阅读
随着计算机运算能力的提升和深度学习技术的迅速发展,基于深度学习的行人重识别方法相较于传统行人重识别方法在识别精度上有了很大的提升。然而,基于深度学习的行人重识别方法通常采用深度卷积网络作为行人特征提取骨干网络,利用高维特征表示行人,这引入了大量的参数量和计算量。本文主要研究内容是设计轻量的行人特征提取骨干网络、轻量的行人特征对齐模块和高效的散列层,可以快速且准确地进行行人重识别。具体工作内容如下:(1)提出了一种基于全局感知轻量骨干网络的行人重识别方法,用于缓解现有深度学习方法使用Res Net50引入较多参数量的问题。在此方法中,主要包括一个全局感知轻量网络模型。该模型主要由空洞窗口Transformer和深度可分离卷积构成。空洞窗口Transformer模块可以减少使用全局Transformer的计算量,并建立长距离与相邻窗口之间的联系。在Image Net2012上,验证了全局感知轻量网络模型以及空洞窗口Transformer的有效性。在Duke MTMC-re ID和Market1501数据集上,验证了基于全局感知轻量骨干网络的行人重识别方法的有效性。(2)提出了一种轻量注意力原型特征对齐的行人重识别方法,用于缓解现有行人重识别特征对齐方法引入高维特征及较多参数量的问题。在此方法中,主要包括一个基于局部注意力原型的行人特征对齐模块和一个基于全局注意力原型一致约束损失。基于局部注意力原型的行人特征对齐模块可以提取局部特征,更加全面的表示行人。基于全局注意力原型一致约束损失约束同一行人特征的一致性,增强全局行人特征判别能力。在Duke MTMC-re ID和Market1501数据集上验证了轻量注意力原型特征对齐的行人重识别算法的有效性。(3)提出了一种自蒸馏特征学习的快速行人重识别方法,用于缓解现有大多数行人重识别算法使用高维真值特征计算相似度效率低的问题。在此方法中,主要包括自蒸馏散列层和基于海明距离的自蒸馏损失。自蒸馏散列层使用多头多损失函数学习策略,约束其学习。基于海明距离的自蒸馏损失可以增强二值特征间的距离与真值特征间距离的一致性,使二值行人特征保留真值特征的判别能力。在Duke MTMC-re ID数据集和Market1501数据集上验证了自蒸馏特征学习的快速行人重识别算法的有效性。
其他文献
随着深度学习技术的发展,基于深度学习的视频目标分割算法已经成为了处理视频目标分割任务的主要方法。但是深度学习模型需要大量的训练数据进行训练,可以预见,靠人工制作视频目标分割数据集将无法满足规模日益扩大的视频目标分割模型的训练需求。基于自监督学习的视频目标分割算法以其不需要人工标注数据集即可对视频目标分割模型进行训练的特点受到了广泛的关注。由于使用的数据集没有经过人工标注,自监督学习方法将直接决定视
随着社会和经济的不断发展,公共交通和物流已经成为生活生产中至关重要的部分。为了维护公共交通和物流的秩序和安全,利用X光安检机来排查行李中的危险物品,成为了安全检查中必不可少的环节。已经有学者利用计算机视觉的方法来代替低效繁琐的人工X光图像危险物品检查。但X光图像复杂混乱,物体之间重叠严重,这给现有的检测方法带来了很大影响。本文针对现有检测算法对重叠严重的X光图像检测效果不佳的问题,利用前后背景分离
随着无线通信技术的发展以及5G技术的成熟与普及,微波多工器作为一种可以分离与合成信号的频率选择器件在卫星通信、雷达系统以及电台调频等领域得到了广泛的应用。由于频谱资源的日渐紧张,对于多工器的性能指标要求也越来越高,其设计难度也逐渐增加。为了适应日渐增加的多工器设计难度,本文将围绕多工器设计开展如下几项工作:1、为了给后续的多工器设计提供理论基础,本文首先对滤波器的设计进行了研究。先是介绍了基于广义
由于每个人的许多生理特征都是独特的,因此利用生物特征进行个体身份识别在本质上更可靠和更卓越。由于人脸识别的非接触性和人脸识别算法的高精度,人脸识别是更可取的生物特征识别解决方案之一。但是,人脸图像数据通常维数很高,会导致“维数灾难”的难题。而且,人脸图像还不可避免地会遭受噪声和遮挡的破坏,导致人脸特征丢失。因此,如何利用降维技术快速地提取特征,从而得到数据的有效低维表示,已经成为了研究界广泛关注的
人脸识别一直是计算机视觉和模式识别领域最关注的问题。近年来人脸识别技术取得了日新月异的发展,但在遮挡人脸识别领域的研究却很少,有待进一步发展与完善。由于COVID-19疫情的爆发,越来越多的人开始在公共场合佩戴口罩。口罩的多样性会产生各种各样的面部遮挡问题,这给人脸识别带来了很大的影响。传统的遮挡人脸识别方法由于缺乏用于训练的大规模遮挡人脸数据集,难以准确识别遮挡人脸图像。此外,现有的上下文注意力
在高中化学教学中开展爱国主义教育,可以从现行化学教材、化学高考题中深度挖掘爱国主义教育的资源,再利用信息技术、任务群、人物传记等多种方式把科学文化知识学习和爱国主义教育融于一体,实现立德树人之教育使命。
随着互联网和智能手机的普及,信息传播媒介逐渐从以文本为主过渡到以图像视频为主。目前,互联网上每天会产生海量的视频数据,亟需设计高效的智能算法对视频进行自动分析。视频描述技术是一种理解并分析视频内容的方法,旨在将视频转换为一段描述视频内容的文本。目前,基于深度学习的视频描述算法已取得不错的结果,但是在提取视频语义信息方面还存在诸多问题,如利用动态特征中的时序信息、加强关键目标的作用、发挥多层级视觉特
随着遥感技术的飞速发展,目前可获得的遥感数据越来越丰富,针对遥感数据的场景理解也越发引起关注。语义分割任务作为遥感数据场景理解中的重要任务,有着极其广泛的应用。虽然基于深度学习的方法已在遥感图像分割领域取得了优异的效果,但还存在资源消耗大、边缘分割困难、上下文处理方法仍需优化等问题。针对这些问题,本文结合多任务学习、注意力机制及类别上下文增强思想对遥感图像语义分割展开研究。本文主要研究内容如下:1
在中国,肝癌的发病率和死亡率常年居于高位。目前肝癌患者在治疗过程中通常通过多时相CT扫描来确定自身肝肿瘤的情况。利用计算机实现CT图像中肝肿瘤的自动分割不仅节省了手动标注需要的人力物力,还降低了人为标注过程中因主观因素造成的误标漏标风险。多时相CT扫描包括按时间顺序获得的动脉期图像、门静脉期图像和延迟期图像三期图像。其中动脉期和门静脉期图像的成像时间相近,图像中各器官组织结构相似,延迟期图像中各器