【摘 要】
:
跨越“语义鸿沟”,让机器完成像素到语义的映射,是计算机视觉研究的根本问题。而对其子领域人体行为识别(Human Action Recognition,HAR)的研究,因为广阔的应用前景,近年来逐渐成为热点,备受关注。本文针对目前行为识别方法的不足,提出一种基于OpenPose的人体行为识别方法和实时框架系统。利用骨架数据量少且能够保留行为关键信息的优点,本文对动作模型表示方法以及如何有效提高视频流
论文部分内容阅读
跨越“语义鸿沟”,让机器完成像素到语义的映射,是计算机视觉研究的根本问题。而对其子领域人体行为识别(Human Action Recognition,HAR)的研究,因为广阔的应用前景,近年来逐渐成为热点,备受关注。本文针对目前行为识别方法的不足,提出一种基于OpenPose的人体行为识别方法和实时框架系统。利用骨架数据量少且能够保留行为关键信息的优点,本文对动作模型表示方法以及如何有效提高视频流的行为识别准确率两个问题进行研究。具体完成了以下几方面的工作:(1)设计了一种人体动作模型构建方法。包括数据规整化及特征设计方法。针对由于人体与摄像头距离和体型差异导致的识别精度下降的问题,本文提出了骨骼关节点数据规整化方法。同时为了充分获取人体行为特征信息,提出全量提取关节夹角距离和位置规整化方法。并通过实验验证方法的有效性。(2)提出动作分割算法(Action Segmentation Algorithm,ASA)。针对目前多帧视频流行为识别准确度较低、系统计算复杂度过高的问题,本文设计了动作分割算法进行优化,并在公开数据集中验证该算法有效性。一个完整的动作通常由起始动作、执行过程、结束动作组成。ASA的本质,是对多帧视频流的时空信息矩阵进行裁剪,得到一个完整动作的时空信息矩阵,剔除掉冗余视频帧数据,从而提高识别精度。(3)基于OpenPose的人体行为识别系统的开发。该系统基于上述研究内容和方法开发完成,由数据获取、动作分割、动作模型构建、Opencv绘图、神经网络构建识别共五个模块组成。目前能够实现基于数据集的人体动作标签的判定。本论文主要以KTH、HMDB51和Weizmann三个公开数据集作为测试数据,试验结果表明,人体动作模型构建方法能够充分地提取动作特征信息;动作分割算法可以有效的获取视频流中动作的时空信息矩阵,进一步提高识别准确率。本文的研究成果可应用于智慧安防、交通违章、游戏等领域,具有一定的现实意义和社会价值。
其他文献
晶体管作为集成电路的最重要的组成部分之一,其性能的提升为微电子技术的发展提供了重要的技术基础。有机晶体管由于其中半导体分子之间通过弱范德华力进行键合,薄膜中的分子相对无序。较多的结构缺陷限制了载流子的传输,通常情况有机晶体管的载流子迁移率相对常规无机材料的器件更低,因此有机晶体管不适合用于对开关速度要求非常高的应用中。尽管如此,有机半导体有着独特的加工方法,大多数有机层通过配置有机前驱体液,在常温
在自旋电子学领域中,由于磁性隧道结有潜力成为下一代磁性随机存储器(MRAM)的基本元件,因此是近些年的研究热点。传统磁性隧道结的势垒层通常是由Al2O3、Mg O等氧化物制备的。但是,制备氧化物势垒层磁性隧道结的工艺复杂,成本较高。单晶二维材料简单易制备的特点可为制备低成本的磁性隧道结提供一个新途径,因而人们对单晶二维材料势垒层磁性隧道结进行了广泛的研究。研究发现,单晶二维材料势垒层磁性隧道结的温
多层复杂动态网络作为复杂网络学科的一个重要分支,在近几年得到了越来越广泛的关注,但相比单层复杂动态网络,关于多层复杂动态网络的研究成果仍相对较少。复杂网络的研究领域众多,包括状态估计、拓扑辨识、同步控制、故障检测、行为特性分析等等,其中状态估计是其余各种研究的前提,只有在网络节点的状态信息已知的条件下,才能进行拓扑辨识、同步控制等研究。在实际中,复杂网络的规模巨大,拓扑结果错综复杂,往往无法直接获
电力系统中单一故障引起的连锁故障是大停电事故频繁发生的主要原因,从单一元件的故障到引起连锁故障造成全网崩溃,往往只是一瞬间,调度人员根本来不及采取有效的控制措施来抑制故障的传播。因此,预先掌握电网的运行状态,辨识并定位电网中的脆弱环节,提前采取保护措施,是避免连锁故障、保障电力系统安全稳定运行有效手段。本文首先从电力网络的结构脆弱性和状态脆弱性两个层面出发,构建了包含网络凝聚度、网络效能变化率、节
随着互联网的高速发展,网络广告市场规模迅速扩大,展示广告成为了最受青睐的宣传手段。精准的广告推荐是互联网平台收益的保障,而准确的广告点击率预测是精准推荐的前提。根据广告平台的更新速率、实时性等要求,广告推荐技术可以分为线下和线上两类。线下广告推荐技术主要基于构建数学模型,通过模型挖掘用户、商品特征之间的复杂关联;线上广告推荐技术主要基于用户的实时反馈,通过收集反馈信息,即时改变推荐策略。本文对线下
流数据往往是由连续的数据块组成,数据流场景下的检索研究是数据挖掘领域的重要基础应用,其在机器学习等各种分析任务中扮演着不可替代的重要作用。特别地,其是电子邮件的分类、新闻推送、医学诊断、文本识别、信用卡欺诈检测等的基石。传统的检索方法不能充分考虑到样本间的语义关系从而在效用和效率方面表现较差。本文基于聚类算法和局部敏感哈希算法来检索数据流文本信息的类别标签属性。特别地,在对文本检索、文本聚类和局部
单片微波集成电路(Monolithic Microwave Integrated Circuits,MMIC)是在同一块半导体基片上的集成多组模块的微波电路,功能可以涵盖功率放大器、低噪声放大器、移相器和衰减器等模块。近年得益于5G无线通信、相控阵雷达等技术的广泛应用,对高频段MMIC的需求也大大增加。研究幅相多功能MMIC对空间通讯、电子对抗等领域有重大意义。本论文首先概述了 Ka波段幅相MMI
智能电网作为未来的能源系统,旨在提高传统电力系统的效率,同时提供更稳定可靠的服务。但是这种高效可靠的服务依赖于频繁地收集和分析电网中的数据,这就带来了新的安全挑战,数据的安全性变得尤为重要。区块链具有数据不可篡改及可追溯性等特点,同时其去中心化的结构天然解决了中心节点失效的问题。本文为提高电网中数据安全,将新兴区块链技术与电网数据存储相结合,利用去中心化的数据存储结构代替传统中心化的存储结构。本文
芴基骨架是有机宽带隙半导体的典型结构,其中芴在9号位上具有比苯更加灵活的功能化特性。基于芴基材料的设计能够确定芴基类化合物的复杂作用并深入了解激子行为、迁移率和稳定性的变化。其中,螺环芳烃(SAHs)具有独特的十字交叉刚性骨架,从而显示出较大的空间位阻和共轭打断效应,这种独特的结构使其具备良好的热稳定性和颜色稳定性,能够广泛地应用于有机光电子领域。目前存在许多关于SAHs合成的报道,然而在减少合成
随着电网改革的深度进行,传统电网已经向集传统电力网络和众多先进技术于一体的智能电网转变。这改善了电力系统供配电能力的同时,也大大增加了其复杂程度,使得维护电力系统稳定运行变得越来越艰巨。电网数据存储是智能电网中的一个重要部分,支撑着智能电网的正常运行。传统中心化的数据存储方式很容易受到恶意网络攻击或因为宕机而产生故障,可能造成中心节点失效、数据丢失或被篡改等安全问题。区块链技术由于其数据不可更改以