【摘 要】
:
当前行人重识别技术的重点研究方向有两个,特征提取和度量学习,前者不仅决定了模型的性能上限,而且也会影响度量学习。由于摄像头的安装角度和安装环境,会导致拍摄的行人图像存在前后角度不一致、图像不清晰和行人部分特征被遮挡等影响行人特征提取的问题。所以当前行人重识别的研究重点是如何提取到一个具有代表性的行人特征,本文的中心是围绕行人重识别所面临的挑战对基于深度学习的行人重识别方法进行研究和改进,主要的研究
论文部分内容阅读
当前行人重识别技术的重点研究方向有两个,特征提取和度量学习,前者不仅决定了模型的性能上限,而且也会影响度量学习。由于摄像头的安装角度和安装环境,会导致拍摄的行人图像存在前后角度不一致、图像不清晰和行人部分特征被遮挡等影响行人特征提取的问题。所以当前行人重识别的研究重点是如何提取到一个具有代表性的行人特征,本文的中心是围绕行人重识别所面临的挑战对基于深度学习的行人重识别方法进行研究和改进,主要的研究内容为:(1)针对行人图像的特征通过局部卷积会导致行人的全局信息和一些隐藏关系在学习的过程中被忽略,行人图像的全局关系没有得到充分的利用。本文提出一种基于空间感知的全局注意力模块,计算空间维度不同位置之间成对的注意力关系,将成对的注意力特征进行简单的拼接,然后对拼接后的特征进行压缩,压缩后的特征是行人图像的最终特征。将这个模块分别嵌入到Res Net-50的前四个残差块中,在网络的最后加入批量归一化层,在损失函数的选择上采用标签平滑损失和本文改进的三元组函数作为联合损失函数。(2)针对行人具有相似属性却不是同一行人,行人图像被遮挡或缺失。本文提出了基于全局特征和局部特征拼接的行人重识别网络,这个网络共有三部份构成,第一部分是粗粒度的全局特征,第二部分是细粒度的全局特征,第三部分是细粒度的局部特征,在第三部分中加入全局对比池(global contrastive ooling,GCP),即在某一块图像缺失的情况下仍然可以通过部分特征,不依赖于整体特征找到正确的行人图像。将这三部分的特征拼接起来作为行人图像最后的特征。在损失函数的选择上采用多损失函数策略对网络进行约束,最后在基准网络Res Net50-IBN-a上进行联合训练。两个网络都在公共数据集Market1501、Duke MTMC-re ID和CUHK03上进行了实验,实验数据表明本文所提行人重识别网络取得了不错的成果,其中基于全局特征和局部特征的拼接网络得到的实验数据更好。
其他文献
全球疫情肆虐、国际局势动荡等都不能阻滞经济全球化的深入,各国企业推进国际化、积极融入世界经济市场的趋势不可阻挡。国际化发展战略与技术创新发展战略并行,成为许多企业的必然选择。对于率先冲出国门的我国家电企业而言,在国际化大潮中如何立足,其国际化对技术创新的影响如何,如何制定国际化发展战略以及技术创新发展战略,这些都是迄需理论和实践层面深层思考的待解难题。本文对典型的国际化家电企业康佳集团进行深度剖析
自改革开放之后,山西省城乡之间GDP差距逐渐缩小,但城市经济发展增速远远大于农村地区,农村地区经济发展较弱,发展动力不足。随着民营快递业的快速兴起,快递政策的扶持,不断推动快递业发展。快递是末端物流,属于物流业的一部分,是我国重要的“第三利润源”。以快递业物流要素的流转带动城乡间协同发展,促进优势资源流入农村地区,提升农村发展动力,为解决山西城乡一体化发展提供了解决方案。本文以山西省116个县区为
刘德海先生作为被人们所敬仰的琵琶演奏家、作曲家以及教育家,在上个世纪七十年代以一首与作曲家王燕樵和吴祖强所共同创作的《草原英雄小姐妹》,开启了中国传统器乐与西方管弦乐团合作的先河。随后到了八十年代,刘德海先生开始潜心创作并达到他创作的顶峰时期。而《人生篇》作品集正是这一黄金创作时期的代表作之一。里面一共有五首作品,包括了《天鹅》、《春蚕》、《老童》、《秦俑》以及《童年》。是刘德海先生回归到关于永恒
网络学习随着多媒体技术和互联网技术的成熟日益完善。在线教育便是二者结合的产物,不仅如此,在线教育还占据了时间和空间两大优势,为不同人群的不同学习要求提供了可能性,为学校教育存在的不足提供了解决方案,其出现也使目前的教育方式更加丰富。但与传统的课堂教学相比,网络教学不能实时监督学习者的学习状况,从而使学习效率不能得到保障。所以,对学习者的学习状态进行检测,有助于改进网络教学系统,改善学习者的学习质量
磁场是最基本的物理量之一,精确的测量磁场尤其是弱磁场(<n T)能够帮助我们更有效的理解这个世界。近年来,随着激光技术与光电检测技术的发展,基于无自旋交换弛豫(Spin-exchange relaxation free,SERF)理论的原子磁力计受到了广泛的关注,目前实现的灵敏度与超导量子干涉仪(Superconducting quantum interference devices,SQUID)
体育教学环境是体育教学活动中的重要因素,体育教学环境的优化对提高教学效果,保证教学质量起着重要的作用。体育教学环境是进行教学活动的基础和保障,任何教学活动都不可能离开教学环境进行。与其他学科相比,体育课的开放性特点更易受教学环境影响,对体育教学环境的研究应引起更多关注。本文的研究对象是晋城市初级中学体育教学环境,运用文献资料法、问卷调查法、访谈法、数理统计等方法,通过发放学生问卷、教师问卷以及与相
无人机可实现快速巡航,将图像回传至管理人员的移动设备,利用光学变焦镜头,在人工有盲区的目标区域进行监测。但在无人机航拍时,由于景深是受限制的,使得传回成像系统的信息局限于目标场景的聚焦区域,此时需要采用多聚焦融合算法获得丰富的场景信息。本文针对上述算法现存在的问题,引入孪生网络到无人机图像多聚焦融合领域,主要在以下两个方面进行了深入研究工作:1)针对现有多聚焦融合算法用于无人机航拍图像时效果不佳,
在智能驾驶领域中,准确识别行人过街意图能够提前规避即将发生的危险,并且减少无效的等待时间,有利于提高行车效率。在现有的行人过街意图识别相关研究中,大多是使用提取到的行人姿态特征进行轨迹预测,但这类方法的数据类型较为单一,易受到环境因素的干扰。因此,本文在行人特征识别阶段将行人检测和人体关键点检测相结合,获取行人过街时的位置信息和关键点坐标信息,接着构建一种结合多头注意力机制的LSTM网络模型进行行
老年人的安全监护是健康养老产业的首要问题,也是一个迫切需要解决的社会性难题。通过检测包含代谢状态和健康程度信息的人体心肺体征信号,可以准确获得老年人的实时状况,是健康监护的首选。近年来,基于调频连续波(Frequency Modulated Continuous Wave,FMCW)雷达的非接触式心肺体征检测技术被广泛研究,并取得了良好的成效。但其存在位姿杂波和人体体动干扰情况下心肺信号检测结果误
激光干涉光刻(LIL)技术是激光干涉产生的周期性或准周期性光场分布,直接或间接作用在材料表面制造出可控的微纳图案。干涉图案可以利用激光器直接在样品表面烧蚀;也可以先记录在光刻胶上,再通过电镀、刻蚀等工艺转移到样品表面,产生微纳图案。激光直写技术是一种精密的激光写入技术,拥有无掩膜、精度高、制作效率高、成本低、加工灵活等优势。本文设计了无需光刻胶的直接激光干涉光刻系统,简化了光刻加工工艺,通过控制高