人体姿态估计的深度网络结构研究

来源 :中国科学技术大学 | 被引量 : 10次 | 上传用户:pengsuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计任务是计算机视觉领域中极具挑战性的问题之一,目标是检测出图像数据中人体的关键节点,比如头部、肩膀、臀部,在行人检测、重识别,行为识别、预测,人机交互等领域都有着广泛的应用。在近些年,随着深度学习和深度神经网络的引入,人体姿态估计的算法性能得到飞跃式的提升,其中最主要的原因就在于深度网络结构的不断革新。人体姿态估计网络框架主要分为两个部分:人体结构应用网络和关键点检测网络。本文中通过对人体姿态及估计任务本身特点的理解和分析,设计了新的人体结构应用网络框架和关键点检测网络。同时,本文中还对所提出的关键点检测网络在相似或相关视觉任务上的推广性进行了研究,如图像分类和语义分割任务。本文的主要工作包括:人体结构应用网络中的全局和局部姿态归一化。人体姿态的高自由度衍生出了复杂多样的关键点相对位置关系,对人体结构建模造成了巨大挑战。本文提出了全局和局部的姿态归一化模块,通过从全局再到局部的归一化设计,逐步降低人体姿态的自由度,将多样的人体姿态变换到一个标准姿态附近,使得关键点之间的相对位置分布更加集中,关系更为单一,从而可以通过少量的参数量构建更有效的人体结构模型。高分辨率关键点检测网络。人体姿态估计是一个对空间敏感度很高的任务,关键点检测网络的输出表征需要具有足够高的分辨率(提供精确的位置坐标)。先前的工作中采用从低分辨率表征中恢复高分辨率表征的方式,导致了空间定位精度的损失。本文从保持高分辨率表征的全新角度设计了高分辨率网络:通过保持高分辨率表征保证足够的空间精度,同时并行引入低分辨率表征增强上下文信息的获取。在网络中通过充分的多分辨率表征融合,让不同分辨率的表征相互促进提高,最终输出具备高定位精度及分类性能的高分辨率表征。从而在人体姿态估计任务中达到了更好的检测性能。高分辨率网络的推广性研究。本文探索了为人体姿态估计任务设计的高分辨率网络向其他相关或相似视觉任务中的推广。通过分类任务头部结构的合理设计,本文将高分辨率网络推广到分类任务中,很大程度上解决了高分辨率网络的模型预训练问题,为在其他视觉任务中的训练提供支持。语义分割任务作为同样是像素层次分类问题也受益于减少表征分辨率损失的网络结构设计。本文也设计了相应的分割头部结构,帮助高分辨率网络处理语义分割中的物体尺度多样性问题。与主流网络相比,高分辨率网络具有低模型复杂度和低计算复杂度的特点,并在实验中展现了显著的性能优越性。综上所述,本文主要研究人体姿态估计中的深度网络结构设计,并分别提出了新的人体结构应用网络以及关键点检测网络。通过在目前的公开数据集上与先前的工作进行性能比较,验证了所设计的人体姿态估计网络具有明显的性能提升。
其他文献
跨境电商在经济新常态下,助力我国进行供给侧结构性改革发挥了突出作用。同时,由跨境电商而引致的全球普惠贸易发展趋势,让更多的小企业能够分享经济全球化的红利,已成为我国
基于无人机摄影测量技术,对盛海花园小区进行了1∶500大比例尺地形图测绘,获得了高精度数字线划成果.通过与RTK测图成果比对,验证了地物点相对于邻近平面控制点的点位中误差、地物点相对于邻近地物点的间距中误差和高程中误差符合规范精度要求.针对无人机测绘的不稳定性,提出了稳健性精度及其验证方法,经检验平面稳健性精度高达93.2%,高程稳健性精度达到86.4%,因此不失为一种可行的测图新手段,对于提高测
二叠系梁山组是黔西南地区页岩气资源调查评价工作过程中发现的重要页岩层系,发育于梁山组底部的黑色页岩为该层系的有利勘探目标层段。通过对区域地质调查、钻井、岩心样品等
构造活动会造成地壳中应力的变化;同时地壳应力又是构造应变的直接驱动来源。上地壳中的脆性构造应变主要表现为裂缝/断层系统的发展。因此,在区域内研究裂缝/断层系统的发展
在贯彻落实国家“卓越工程师教育培养计划”的背景下,结合测绘工程专业实践教学的具体情况,分析了当前测绘专业实践教学环节中存在的一些问题,对测绘工程专业实践教学模式进行了
微波传输线是电磁场技术领域的重要的部件,它是设计各种微波电路与器件的基础。随着微波技术和集成电路技术的发展,集成微波传输线已成为研究的热点,介质集成波导和介质集成
在强调法洽的背景下,劳动教养审批活动存在诸多问题,要彻底解决劳动教养审批问题,就必须强化劳动教养审批检察监督机制的构建,尽快将劳动教养制度纳入司法程序,从立法上明确办案、
现阶段,我国城乡发展速度较快,城乡建设活动广泛进行,加快了建筑材料在建设过程中的输入和输出,随着城乡人居环境更新,大量建筑被拆除,也产生了难以估量的建设废料,这些建设