基于深度学习的人体姿态估计方法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:omine001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计是当前计算机视觉中重要的组成部分,是动作识别的关键步骤。随着深度学习的迅速流行,使得实现快速且准确的人体姿态估计任务成为可能。研究如何使得人体姿态估计任务更好的根据现实需求应用于视频中逐渐成为当前具有重要现实意义的研究内容。该文探索了人体姿态估计算法中所涉及的处理速度及精度之间平衡性的相关因素,最后形成了一种有效的人体姿态估计方法。目前已经存在多种人体姿态估计方法,包括单人姿态估计方法和多人姿态估计方法,其中单人姿态估计方法的研究已经比较成熟,当前主要研究方向是多人姿态估计方法。针对多人姿态估计在视频中的应用,大多数方法特别关注准确度而忽略实际应用中对方法处理速度的要求,本文所做的主要工作是对多种现有的具有代表性的单人和多人姿态估计方法进行研究,通过多组对比实验分别对这些方法的处理速度和准确度的相关指标进行探索和分析,提出可行的相关改进想法有针对性的改进了相关方法,并与原方法进行对比实验,从而得出了影响人体姿态估计准确度和处理速度之间平衡性的若干因素,由此基础上该文提出了一种通过改进Dense Net网络进行人体姿态估计的方法。所提出的基于改进Dense Net网络的人体姿态估计方法,可针对图像中由于人的数量不确定对处理速度的影响,以及不同人体或人体自身部位的相对大小差异等尺度因素影响导致的通用关键点检测方法检测效果不佳等问题,其设计了一种改进的Dense Net网络结构用于人体姿态估计。该方法采用一种单阶段的端到端的网络结构,其利用深度卷积神经网络进行特征提取,在卷积网络末端通过特定的尺度转换结构得到6种不同尺度的特征图,使得网络能够同时使用不同层次的特征进行多尺度关键点检测,有效地提高了检测精度。该方法采取自底向上的方式,能让网络进行多人姿态估计任务的处理速度得到保证。实验表明该文提出的方法与其他几种方法在综合性能的比较上占据优势。为探索人体姿态估计方法的处理速度与精度之间均衡性提供了一种有效的新方法。
其他文献
互联网的发展使视频数据呈爆炸式增长,有效地处理和分析海量视频数据成为一项重要的任务。充分利用视频数据,可应用于视频安全监控、视频检索与分类、人机交互和无人驾驶等方
随着舰船的现代化设计不断向着轻量化、大型化以及快速化方向发展,船体产生的振动问题也是越来越严重。尤其对于船体艉部部分,由于船舶的螺旋桨和动力设备通常会布置在船艉,
无线传感器网络是一种分布式网络,它由大量的传感器节点组成,多个传感器节点之间通过无线通信的方式形成通信网络。近年来,无线传感器网络凭借其无中心、自组织组网、快速部
三角褐指藻是一种具有重要经济价值和生态学意义的多形态单细胞硅藻。该藻生长在海洋或盐湖中,可以合成和累积岩藻黄质,金藻昆布糖,多不饱和脂肪酸等高价值化合物。此外,由于
冷冻电镜(Cryogenic electron microscopy,Cryo-em)是一种能够实现生物大分子三维重构的技术,它通过冷冻电镜图像和三维重构软件获得高分辨率的生物大分子结构。由于冷冻电镜
2013年党中央首次提出“精准扶贫”这一概念,即在对象、因村派人、项目安排、脱贫成效、资金使用、措施到位这六个方面都要做到精准。要真正理解“精准扶贫”工作,就先要抓住
围绕地方政府举债规模扩张迅速的问题,以往文献多研究财政分权对政府债务规模的影响机理,本文认为传统的财政分权理论不能完全解释债务规模迅速膨胀的动因,故以地方政府间债
对癌症进行早期诊断,并及时治疗对于癌症患者来说非常重要。以乳腺癌为例,现行的诊断方式,如乳腺钼靶X射线摄影检查、超声检测、X射线计算机断层扫描等技术,虽具有一定的成效
近几年随着计算机和智能手机的发展,当今社会已经逐渐步入人工智能时代。语音是人类最便捷的交流方式,这使得人机语音交互成为研究热点,许多科学家开始关注人机语音交互,实现
随着社会的发展和城市化进程的加快,伴随而来的环境污染、生态破坏等问题也日益严重,其中,雨水问题以及其所引发的城市内涝、水质污染等一系列问题严重影响人们的生产生活。