【摘 要】
:
近年来,视频图像自动识别技术已经取得了显著的进步,人脸识别,车牌自动识别等视觉技术已经成为人们的日常,得到了非常广泛的应用,但是对于大多数用户来说,视频动作识别相对陌生,这与人民日益增长的安全需求相矛盾,所以基于监控场景的视频动作识别系统的普及也越来越迫切。本文的主要工作如下:(1)针对经典时空卷积网络(STGCN)对骨骼信息利用不足的问题,本文设计了一种基于多信息融合的残差时空图卷积网络。首先在
论文部分内容阅读
近年来,视频图像自动识别技术已经取得了显著的进步,人脸识别,车牌自动识别等视觉技术已经成为人们的日常,得到了非常广泛的应用,但是对于大多数用户来说,视频动作识别相对陌生,这与人民日益增长的安全需求相矛盾,所以基于监控场景的视频动作识别系统的普及也越来越迫切。本文的主要工作如下:(1)针对经典时空卷积网络(STGCN)对骨骼信息利用不足的问题,本文设计了一种基于多信息融合的残差时空图卷积网络。首先在利用了骨骼边信息和骨骼点信息在高维空间直接进行信息融合,使得模型可以提取到更多可区分特征。其次针对时空卷积网络的非线性能力不足的问题,在网络中添加了残差连接,使得网络加深的同时不会产生梯度消失的问题。最终在NTU_RGB+D动作识别数据集上,多信息融合的残差时空图卷积网络比时空卷积网络Top-1准确率提升了5.7%。(2)基于简单动作的识别需求考虑,本文设计了一种基于静态骨骼点的残差图卷积模型,通过空间图卷积和策略去识别人体的静态动作,在自建数据集上的准确率达到了98%,可以进行准确且稳定的动作识别,以达到实际使用的目的。(3)设计并实现了基于监控场景下的动作识别系统,利用基于静态骨骼点的残差图卷积模型,对长期站立(罚站)、蹲着、长期举手等动作进行有效准确的识别,在纪委的巡查以及监狱巡查等领域有着非常实际的应用价值。
其他文献
数字技术的迅猛发展和普遍应用,改变了传统的知识获取方式,也对出版业产生了深刻影响。市场、产品、渠道等各方面的融合为教育出版开拓了更为广阔的价值创新空间,与此同时,教育出版产品形态不断更新,运营模式、价值传递、盈利模式等关键要素发生了巨大变化。传统出版企业原有单一化的商业模式已经无法适应更加多元化和动态化的产业环境,不利于企业在新融合市场内价值的开发实现。因而需要及时整合内外部条件进行创新来克服发展
公民的姓名是由其姓氏和名字所构成,姓氏在传统观念里被认为是氏族血缘关系的象征,名字则是对公民个人的代表。但随着时代的不断变迁,姓名权行使越来越被人们所重视,公民姓名中的传统象征意义逐渐减低,人们更加追求对自我个性的表达,公民在取名和称姓的过程中往往会追求与众不同,因此,关于姓名登记的行政案件不断出现在大众视野当中。而公民的姓名权行使方式之一就是公民对其姓氏或名字进行决定或更改,但作为公民基本权利之
翻译关联理论解释了语言交际和推理以及语境对翻译的影响。该理论从交际意图和信息意图、语境假设、关联性等方面阐释了翻译,并为翻译实践提供了指导。本文借助该理论,探讨翻译实践中冒险小说的翻译。本次所选的With Sword and Crucifix是Edward Sims Van Zile笔下的一本冒险小说。本次研究范围为前6章,该小说情节起伏,人物性格突出,以殖民开拓时代为大背景,讲述了主人公在密西西
人与机械的自然融合可以充分发挥人的智能和机械的精巧能力,在军事、医疗及安防等领域具有重要价值。本文根据六自由度(degree of freedom,DOF)机械臂建模,并进行正向运动学(Direct Kinematic,DK)和逆向运动学(Inverse Kinematic,IK)仿真。对运动规划方面的问题深入研究,包括关节空间轨迹规划和直角空间轨迹规划。在此基础本文基于Media Pipe机器学
在互联网平台经济发展的背景下,网络问答平台的价值活动被重构,平台通过创造广泛的连接,来进行多边市场的构建和运营,形成了一个整合知识创作者、资源提供者和终端消费者等多元化参与者的知识生态系统。然而面对外部高压的竞争格局以及内部参与者的价值冲突,问答平台仍面临着商业化优势不突出、用户难以建立价值认同、经营成本提升而入不敷出等转型难题。目前学界对网络问答平台如何管理和协调参与者之间的利益分配,构建价值共
随着人口老龄化的加剧,我国肿瘤的新发数和死亡数持续上升,导致多数人认为患上肿瘤就等同于死亡。而事实上,如果人们能提前了解肿瘤的相关知识,并积极采取行动,那将有近半数的肿瘤病例是可以避免的。在肿瘤知识信息化的今天,人们虽然可以很轻易的通过搜索来获取所需,但这其中包含着大量不准确的信息,严重影响了人们的判断。于是,肿瘤知识推荐系统应运而生。它可以向公众科普肿瘤预防的方法,改善肿瘤患者的生存质量,同时帮
Transformer是一个基于多头注意力机制的深度学习架构,在自然语言处理领域具有里程碑式意义,在业界很多大规模模型上得到了广泛的应用。近年来,Transformer也成为计算机视觉领域的重要研究方向。Transformer架构引入了并行化,利用并行训练,可大大减少训练时间,提高计算效率。2021年,新一代国产申威众核处理器SW26010Pro正式推出,其配套的软件环境中已完成了对Py Torc
在许多研究领域,对多个数据集的联合分析变得越来越重要。当在几个独立的实验中研究其相同的特征时,一种常见的综合方法是联合分析多个测试结果的多个序列。本文研究了基于隐马尔可夫模型的信号三分类问题,并在大规模基因组学领域针对各种病毒做了一系列应用。引入了正负两方向的错误分类率(FDR),并开发了基于参数的Oracle算法和基于数据的Data-driven算法来控制每一种错误分类率,同时实现最大的预期正确
随着国内网上零售高速发展,消费者的行为习惯也发生了天翻地覆的变化,各类营销模型争奇斗艳,其中将互联网与线下商务渠道有机结合的O2O商业模式发展最为迅猛。目前针对O2O商业模式的技术支持和落地实战的研究较为丰富,而对O2O优惠券如何提高核销率的核销因素研究相对稀缺。分析O2O优惠券核销因素,不仅能够帮助商家制定更高效的促销策略,也能帮助消费者屏蔽各类促销优惠活动的干扰,准确的判断优惠券的实际优惠价值
光学三维检测技术有着广泛需求,面结构光检测技术被大量应用在视觉检测、质量检测、逆向工程、三维重构和SMT(表面贴装技术)贴片等诸多领域。随着计算机的发展,学者们对光学三维测量的研究越加地深入。本文研究基于结构光进行三维SMT贴片缺陷检测,主要研究相位计算方法、三维测量系统的标定技术、硬件平台的设计和三维SMT贴片缺陷检测。结构光系统标定是三维检测的前提步骤,在主动视觉技术中,通常需要对摄像头和投影