基于姿态估计的视频动作分析研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:guo20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着生活水平的提升,人们对体育运动的参与度越来越高。但运动的开展需要专业教练的指导和点评,动作不规范轻则达不到锻炼效果,重则损伤身体机能。动作分析技术的出现,使得人们可以随时随地了解自身动作完成情况,获得专业的点评。传统的动作分析方法主要基于运动捕获设备,存在佩戴不方便、设备高成本、方案不通用等缺点。基于视觉的相关研究很多,但基本都局限在视频动作分析的某一环节,缺少一种从视频数据到人物动作分析结果的端到端解决方案。将现有技术应用到视频动作分析中,还需要解决诸如人物运动模糊、关键点遮挡、相似动作区分等问题。由此,本文提出了一种基于姿态估计的视频动作分析方法,先对数据进行人物运动模糊消除和关键点弥补处理,然后再进行动作内容识别和动作规范性评估。本文的主要贡献如下:
  针对视频中可能出现的因高速运动而产生的人物运动模糊现象,提出了一种基于生成对抗网络的人物运动模糊消除方法,采用残差网络结构避免梯度消失,使用跳跃连接级联图像不同尺度特征,并改进了损失函数的构成,能够对人物视频进行去模糊处理,提高了动作分析的准确度。实验结果显示,该方法在GoPro数据集上的图像还原峰值信噪比达到35.27dB,结构相似性指标达到0.956,均优于大部分同类方法,并且在图像细节上还原质量较好。
  针对现有动作内容识别方法对相似动作区分精度不高的问题,提出了一种基于图卷积网络的动作内容识别方法,将人体骨架图按照结构特点划分为几个子骨架图分别提取特征,再根据子结构间的动作交互情况进行融合,使得网络更容易关注到子结构间的细微差异,提高了动作内容识别的准确率。实验结果显示,该方法在Kinetics数据集上的Top1和Top5准确度分别达到35.2%和57.6%,均优于大部分同类方法。
  针对现有动作规范性评估方法通用性不强的问题,提出了一种基于人体时空图空间体的动作规范性评估方法,通过比较人物动作和模板动作对应时空体的吻合程度评估人物动作的规范性,能够对任意人物动作进行规范性分析而无须针对性地设计。同时该方法可应用到具体人体部位之上,得出相应部位的动作规范性程度,解决了动作规范性评估不够精细的问题。
  实验结果表明,本文提出的基于姿态估计的视频动作分析方法较好地解决了人物运动模糊和关键点检测缺失问题,对人物动作的识别和规范性评估相比现有方法具有更高的准确度和精细度。
其他文献
【摘要】由于在运用电动机时被较多因素所干扰,比如影响电动机的内部以及外部因素,进而发生故障问题,不但对设备的正常运行造成极大的影响,并且还影响了工业企业的正常生产活动。近年来,我国电力行业得到快速提升,很大程度的提高了电动机的制备能力,并且其质量也不断提升,从而降低了电动机运行过程中的故障。但是,目前在电动机运行过程中依然存在一定的故障,从而一定程度的阻碍着生产活动的进行。本文就通过介绍交流异步电
期刊
正交时频空(Orthogonal Time Frequency Space, OTFS)调制技术为处理时变多径信道中的高多普勒频移问题提供了巨大的潜力,其关键思想是将时频域内随机衰落的信道转换成时延-多普勒域中稳定非衰落的信道,从而使得每个信息符号都会经历恒定的平坦衰落。本文致力于采用仿真的方法对水声OTFS通信系统进行研究,同时基于统计水声信道模型与Watermark(Underwater Acoustic Channel Replay Benchmark)实测信道数据分析OTFS调制技术应用于水声通信
深度学习技术的发展,为各行各业带来了蓬勃的生机。特别是语音合成技术中,深度学习取得了巨大的成功。以Tacotron为首的端到端的语音合成技术使构建语音合成系统变得更加简单的同时,也使得合成的语音具有更高的可懂度和自然度。今天,语音已经逐渐的走入了我们的生活中。各种语音助手、语音交互功能方便着我们的生活。目前的语音合成技术依然存在瓶颈,还是停留在能发出人类听得懂的声音这个阶段,还无法实现情感的表达,无法像人一样进行生动的演说。这一点是目前制约着语音合成系统迈向更广泛应用的关键。于此同时,端到端的语音合成系统
【摘要】依托某水电站混凝土施工项目,不仅通过选用合理的模板选型、混凝土配合比、混凝土入仓手段和施工仓面设计、浇筑过程、养护等进行规划,而且还要就清水混凝土施工质量、机械化操作水平、作业情况,以及施工养护情况等进行对比性分析,进一步对清水混凝土技术要点进行探究和分析。  【关键词】水电站;清水混凝土;施工技术;应用  一、项目概述  地下廠房布置于左岸山体内,纵横线方向N55°E,最小水平埋深约36
期刊
非侵入式负载监测通过单一传感器有效准确地监测住宅单个电器设备的能源消耗,对全球关注的节能减排问题有着至关重要的效用。除此之外,非侵入式负载监测还能有助于优化智能电网的能源管理,改进家电设计,提升运作效率。传统的负载监测方法存在着分辨率低和实时性差的弱势,特别是在家居智能化的多变场景下,既有的算法模型无法满足高精度和强迁移性的要求。
  深度学习在相关问题中表现良好,特别是对于数据量庞大的样本,可以有效进行特征提取,避免繁杂冗余的数据建模,基于高效的深度神经网络,本文提出了跨场景的实时非侵入式负载监测
近年来,随着移动手机等智能终端的普及和移动计算技术的发展,位置服务(Location Based Service,LBS)越来越受到人们的青睐,它给人们带来方便的同时,也增加了隐私泄露的风险,攻击者可以很轻易地从位置信息中提取出用户的家庭地址、健康状况、收入等信息。目前用户位置隐私泄露的途径主要有两种:(1)某些组织或机构为了科研目的公开用户的位置数据,攻击者获取这些数据后,采用大数据等相关技术,挖掘出用户的隐私信息;(2)用户在接受位置服务时,受到攻击者攻击,导致隐私泄露。因此开展LBS中用户隐私保护技
【摘要】在大型水利水电工程项目管理过程中,其涉及的范围十分广泛,因此,必须从多个角度加以考虑。本文以大岗山水电站项目为例,具体分析与阐述了大型水利水电工程项目的管理方法。  【关键词】水利水电工程;项目管理;管理方法  1、引言  结构复杂、位置固定、形式多样、体积较庞大等均为大型水利水电工程的特点,同时,大型水利水电工程的施工周期较长、涉及到的资源种类繁多及用量较大、空间流动性较高。因此,大型水
期刊
随着城市交通拥堵问题日益严重,智能交通信号控制技术作为缓解交通拥堵最有潜力的方法之一,受到了国内外广泛的关注。由于交通系统具有复杂性、动态性和非线性的特点,基于对交通系统建模的传统自适应交通信号控制算法,已经不能应对日益多变的交通流。针对这一问题,有学者提出了基于强化学习的交通信号优化控制算法,因为强化学习方法不需外界环境的具体模型,通过不断地与外界进行交互,试错学习,实时调整策略,可以在复杂交通系统中取得很好的控制效果,成为近年来研究的热点。本文基于深度强化学习算法设计了城市智能交通信号优化控制算法,本
一直以来,异常用电行为导致的非技术性损失从经济和安全方面严重影响着电网的正常运转。异常用电检测作为降低非技术性损失危害的核心问题,受到持续关注。随着我国智能电网的全面建成,电网积累了海量的历史电气数据,为基于数据驱动的异常用电检测方法奠定了基础。尽管近年来,大数据分析与机器学习技术得到了长足的发展,然而基于数据驱动的异常用电检测仍然存在以下待解决问题:1)如何降低数据质量不佳的影响;2)如何在检测算法中融入电力知识和理论;3)如何让检测算法能够在数据案例不足的情况下对异常样本精准、有效地召回;4)如何保证
近年来,低成本的多旋翼无人机凭借其机动性强、可扩展性高等优点正迅速走向民用。然而,无人机有限的续航时间和通信距离限制了其服务范围。因此,在实际应用中,通常会利用车辆搭载无人机到达目标区域的附近,然后再出动无人机执行任务。高效的车辆和无人机协同能极大地提高效率、节省成本,因此引起了学术界的广泛关注。然而,现有的相关工作大多侧重于研究车辆-无人机协同进行物流配送的场景,缺乏对无人机巡检场景的关注。除此之外,现有研究大都只考虑车辆与单架无人机协同的模式,而多架无人机并行执行任务能显著地提高效率。
  鉴于