基于密集3D部件对齐的行人重识别方法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:dddnnn111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是指在跨摄像头的场景下进行行人的匹配。它是计算机视觉中的热门研究领域之一。在实际应用场景中,摄像机拍摄角度的变化、身体部件被拍摄场景中物体遮挡以及行人姿态存在多变性等问题使得行人在检测框内的空间上不对齐,这给行人重识别的特征提取阶段带来了极大的挑战性。因此,如何在跨视角场景下获取具有高判别力的特征是行人重识别的研究重点。针对以上问题,本文提出了基于密集3D部件对齐的行人重识别方法研究。具体内容如下:
  (1)基于密集3D人体姿态估计的部件对齐。大量的工作使用2D人体姿态估计方法获得对齐的行人图像。然而,姿态估计误差会导致框架无法精确地检测到关节。在此情况下,大量部件会丢失。其次,由于2D空间下的信息有限,同一行人在不同的图像中可能包含的部件信息并不相同。借鉴DensePose模型,本文提出了多帧补全的密集3D部件对齐算法,将行人对齐到像素级别的3D密集空间中。即使有部分部件无法被检测,利用多帧补全的策略可以缓解DensePose模型部件信息完全丢失或部分损失的问题。
  (2)基于密集3D部件对齐的行人重识别。为了进一步提升密集3D部件特征的鲁棒性,我们设计了一个像素对齐的多分支部件重建网络,将行人图像上的像素点映射到一个统一的密集对齐空间。具体来说,我们采用的是多任务学习方案。它包含部件重建任务和行人重识别任务。在重构子网中,我们分配了重建24个部件图的任务,同时在主干网络中进行特征表示学习任务,来学习密集对齐特征。实验结果表明,我们的方法具有很好的效果,并优于许多前沿的方法。
  本文通过以上研究,解决了行人重识别任务中的行人不对齐问题。首先,采用DensePose模型以及多帧补全的策略构建密集3D对齐部件图。然后,设计了一个特征表示学习网络来提取密集3D部件对齐特征。最终的实验中,我们的方法取得了较好的成绩,对研究行人重识别中的行人部件在空间中不对齐的问题具有参考价值。
其他文献
学位
学位
学位
学位
学位
基于内容的图象检索在多媒体数据加和Internet网络资源的管理和利用中得到越来越多的重视,具有广泛的发展应用前景.该文主要研究了基于图像的底层特征(如颜色、纹理和形状)与相关性反馈来进行图像检索的方法,并且建立了一个实用的基于内容的Internet图像检索系统以及一个一放式的实验平台.我们采用不同的颜色空间和颜色特征,实现了多种基于颜色的图像检索算法,并且在我们建立的彩色图像数据库上对这些算地进
学位
在公路设计中,公路纵断面的自动优化设计一直是公路设计人员研究的课题.该文针对初始纵断面的自动形成(自动定坡)和公路纵断面的优化设计作了详细的讨论.该文的自动定坡方法是在三角形高程加权和最小二乘法的数理理论基础上形成的.文中介绍了纵断面优化设计中常用的一些传统算法,讨论了纵断面优化问题数学模型的建立方法,并重点介绍了动态规划法.动态规划法因其算法简单易行且优化精度高而一直受到工程设计人员的青睐.根据
机器阅读理解是自然语言处理领域的一颗明珠,同时也是该领域的研究焦点。机器阅读理解技术可以广泛应用于语音助手、智能客服、聊天机器人等领域。近年来,得益于大数据和深度学习技术的兴起,机器阅读理解获得了广泛的关注。在传统的工作中,主要采用基于规则和基于深度学习的方法。其中,基于深度学习的方法对问题和上下文分别进行编码得到向量表示,然后利用注意力机制使得两者进行交互,最后利用交互的语义信息预测答案的开始和
目标检测是计算机视觉领域的重要方向,随着深度学习方法及相关硬件设备的发展,它在自动驾驶、智能监控、智能手机等方面都有着广泛的应用,具有重要的研究意义。  基于无锚框深度学习的目标检测是一种主流的单阶段目标检测算法。融合多层监督信息的沙漏网络结构能够显著提升无锚框目标检测算法的精度,然而其速度却远低于同层次的普通网络的速度,并且不同尺度目标间的特征会互相干扰。针对上述问题,本文提出了一种非对称沙漏网
学位
测量胎儿头围可估计胎龄和监测胎儿的生长。医学超声影像技术由于其廉价性、无辐射和实时性,成为测量胎儿头围的首选方式。然而,目前的主要测量方式是通过有经验的医师手动测量,测量精度依赖于医师临床经验。这种方式易导致超声图像测量耗时,增大医师工作量。现有有经验的医师资源并不充足,一些落后地区更为明显,影响孕妇产前检查的准确性。为了提高超声测量的工作效率以及准确性,本文提出一种测量方案帮助解决自动测量胎儿头