基于深度学习的静态图像人体姿态估计研究与实现

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:liongliong545
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计是计算机视觉领域的基础性问题之一,它在行为识别、人机交互、游戏、动画、自动驾驶等领域均有着广阔的应用前景。基于深度学习的静态图像人体姿态估计任务是将图片输入到网络模型中,输出图片中人体关键点(如头部、手腕、膝盖等关节)的精确像素位置。对静态图像进行人体姿态估计是视频姿势估计和跟踪等相关问题的基础,同时对于动作识别等更高层次的任务也非常有帮助。随着深度学习技术的发展,静态图像人体姿态估计也进入了快速发展的阶段。但是,由于静态图像中存在人体遮挡和动作本身复杂的原因,目前人体姿态估计算法的精度和效率仍不能满足实际应用的需求。针对精度和效率两方面的问题,本文分别提出了一种基于双注意力残差块的人体姿态估计算法和一种基于轻量级模块的人体姿态估计算法。主要研究工作和创新之处如下:(1)基于双注意力残差块的人体姿态估计算法。为了提高人体姿态估计中关键点检测的准确度,本算法通过在残差块中加入通道注意力和空间注意力模块,将注意力机制引入到高分辨率网络HRNet中。在此基础上,算法还提出了一种并行注意力残差块,即在瓶颈残差块中并行接入带有基数的卷积层,然后对这两个分支分别增加通道注意力和空间注意力模块,最后将这两个分支的结果相加,进一步优化HRNet。本算法使得网络在浅层即可强调对人体姿态估计重要的目标区域信息,抑制不重要的信息,同时帮助网络在深层提取到更高质量的特征。在MPII和COCO数据集上的实验表明,本算法可以进一步提升人体关键点检测的准确度。(2)基于轻量级模块的人体姿态估计算法。为了减少人体姿态估计网络中的参数量和计算量,将HRNet中的基础残差块全部替换为轻量级模块,提出一种基于轻量级模块的人体姿态估计算法。轻量级模块的基本思想为:首先,将输入特征图进行标准卷积,降低其通道数;接着,对降低通道数的特征图进行深度卷积,保持通道数不变;然后,将二者进行拼接,再通过一层标准卷积使通道数恢复到输入通道数;最后,与原始的特征图相加得到最终的输出结果。实验表明,本算法可以在保持网络精度的同时,大量降低模型的参数量和计算量。图22幅,表11个,参考文献89篇。
其他文献
我国汽车保有量快速增长,已位居世界第二,随之而来的汽车维修服务需求激增,有效解决因专项汽修厂维修台配置不合理而导致的顾客等待时间过长的问题,对提高汽修厂效率和顾客满意度至关重要。运用排队论、系统仿真等理论方法对专项汽修厂的维修台配置进行了研究。通过对某专项汽修厂的实地调研,发现该专项汽修厂存在先到先修理和维修台具有优先级的排队规则,同时对相关数据进行了采集和分析,得到了单队列两类型维修台排队模型的
学位
介绍了某数据中心项目水蓄冷系统设计内容,分析比较了采用闭式蓄冷罐、消防水池(兼冷却水补水池)、独立水池不间断供冷及日间释冷系统3种不间断供冷系统的利弊,分析比较了采用闭式蓄冷罐和独立水池不间断供冷及日间释冷系统的运行费用。经技术和经济比较,不建议数据机房类项目将冷却水补水池或独立水池用于水蓄冷。
期刊
报纸
煤是一种富含有机质和少量无机矿物的沉积岩。其中,矿物质的存在降低了煤的质量和利用价值,严重影响煤层气井后期的产气量。因此,煤炭利用前往往要脱出矿物质。其中化学脱灰是较常用的手段,但除去矿物质时,可能对煤的溶剂萃取性能及萃余物结构造成影响。本文以山西古交焦煤为例,首先对采自新鲜工作面的焦煤煤样HCI、HF酸处理,以除去煤中碳酸盐和硅酸盐矿物,得到酸洗煤样(DC),而后在不同温度下用不同浓度的四氢呋喃
学位
属性基加密作为一种新型的公钥密码原语,通过对用户私钥或密文设置属性集或访问结构,只有属性集和访问结构相匹配时才能解密,实现了云存储环境中数据的安全共享与细粒度访问控制功能。但在属性基加密方案中,其计算开销会随着属性数量的增加和访问结构复杂度呈线性递增关系,尤其是可穿戴设备的大量应用,无疑给设备终端带来庞大的计算负担,如何减少设备的存储和计算成本显得至关重要;此外,数据拥有者依照访问策略将加密后的密
学位
随着全球环境污染问题与能源危机日益严峻,新能源的开发与利用成为未来发展的新趋势。电动汽车是新能源在汽车行业的应用,以其高性能、低污染的优势列入我国七大战略性新型产业之中。电池作为电动汽车的核心部件,需要电池管理系统(Battery Management System,BMS)对其进行有效的管理,以提高整车系统的高效性与稳定性。BMS的主要功能包括电池状态分析、数据采集、能量控制管理、安全保护、均衡
学位
图像语义分割通过给每个像素分配相应的语义标签来解释与理解图像,被广泛应用于自动驾驶、医疗图像辅助诊断等领域。近年来,随着以卷积神经网络为代表的深度学习技术的不断发展,基于深度学习的图像语义分割方法被相继提了出来。语义信息与空间信息是语义分割的两个主题,二者对提高语义分割的性能都起到重要的作用。语义信息是图像中深层次特征的抽象表示,有利于对像素分类;空间信息包含着图像的空间结构,有助于准确预测目标边
学位
随着移动定位技术的成熟和无线通信技术的持续发展,基于位置的服务与人们的生活越来越密不可分,但是在用户享受该服务带来的便利的同时,也面临着位置隐私泄露的风险。在位置信息产生、存储、处理和使用的过程中保护其不被攻击者获取利用的前提下,满足人们各种各样的基于位置的服务请求成为亟待解决的问题,受到研究者们的普遍关注。本文围绕位置隐私保护问题,系统分析了现有的位置隐私保护技术。传统的假位置生成算法产生的虚假
学位
随着移动智能终端、无线通信网络和定位技术的发展,基于位置服务(Location Based Services,LBS)技术得到日益广泛的应用。用户对LBS的依赖性与日俱增的同时,也面临着个人隐私泄露的风险。近年来,国内外学者在位置隐私保护领域做了大量工作并取得一系列成果。现有的位置隐私保护方案大多采用的是基于可信第三方(Trusted Third Party,TTP)的集中式结构,但现实中可信第三
学位
在流化床粉煤气化运行过程中,由于气泡运动而造成的压力波动已得到广泛认同。压力波动的随机性和间歇性会给设备和安全生产带来极大的危害。对此,本文以流化床中气泡运动引起的压力波动为研究对象,对不同流型的压力波动风险进行分析,并通过K-means聚类算法识别不同流型。首先,本文采用广义极值分布对流化床运行过程中的四种流型压力波动数据进行极值统计建模。结果表明,采用广义极值分布拟合随机过程下的压力波动数据得
学位