基于深度学习的时空动作识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:roger84115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于视频播放平台的快速发展、摄影设备的不断迭代以及移动通信的广泛使用,视频的数量呈现爆发式地增长。因此,如何从视频中提取信息就成为了一个亟待解决的问题。动作识别是视频理解领域中一个基础而关键的问题。早期,研究者通常使用手工设计的特征来捕捉时空特征进行分类。现今深度学习方法凭借其强大的特征提取与拟合大体量数据能力在动作识别领域取得了重大突破。然而,现有深度动作识别方法对于识别复杂场景下的动作仍然存在一些障碍。首先,现有方法识别RGB视频中多样且变化快速的动作仍很困难。主要原因可归结于以下两点:首先,复杂的动作视频中常常有大量背景及许多无关的人,而现有方法常被这些无关因素干扰而无法定位到动作执行者,因此造成识别困难。其次,复杂的动作常常需要模型结合身体各部分细节变化来组合识别动作,而非仅靠整体特征就能识别。然而大部分方法依靠卷积神经网络搭建从而缺乏建立图像不同部分间视觉关系的能力。我们提出了一个新的以人为中心建立视觉关系的方法,在两个大型公共数据集上的表现超越目前主流的识别方法。其次,骨骼点数据由于其紧凑、不受背景和无关因素影响的特点在高精度动作识别方面有很好的应用前景。然而,现有方法对于建模骨骼点数据中关节间的关系仍有很多不足,难以良好地更新节点特征。早期的方法直接将骨骼点数据重塑为二维矩阵送入网络提取特征,忽略了节点间内在的连接关系。之后图卷积网络将关节视为图网络的节点,使用固定不变的邻接矩阵来描述节点间的关系。部分方法引入了自注意力机制来自适应地建模节点间关系,扩大了节点的空间感受野。然而它们都需要经过多层网络才能使节点有效地获取其他节点特征,增加了信息损耗。我们提出了时空图注意力网络来解决这一问题,在三个公共大型数据集上的表现超越了目前主流的方法。
其他文献
在海洋工程模型实验中进行波高数据采集时,往往需要在较远的距离处对多个分散位置的波浪信息进行准确测量,因此需要数据采集系统不仅具备较高的数据传输率及可靠的传输方式,而且还要有较高的实时性和测量精度。然而,现今的波高数据采集系统电路设计复杂、可靠性较差、数据采集通道有限、现场布线复杂,无法满足海工模型实验的需求。针对海工实验中波高数据采集所面临的问题,本文提出了一种新型电容式波高传感器的设计方法,并采
近年来,随着扫描技术的迅速发展,点云已经成为计算机视觉领域的研究热点,并逐渐发展为三维形状分析的主要研究对象。三维形状分析通过数字几何的算法,挖掘三维模型的几何特征、语义关系及模型的功能性。如何准确、有效地实现三维形状分析,是机器人感知、无人驾驶及虚拟现实等任务的基础,有着广泛的应用前景。三维形状分析主要包括模型检索,模型分割,语义对应,功能性分析等任务,而三维形状的局部特征能够准确地描述形状的局
城市化进程加快使得住房建设规模扩大,相关行业发展迅速,但是行业的迅速发展也使得其中存在的问题也越发凸显,例如住房建设中的卫生间渗漏问题,其作为房屋建设中的重要问题之一,直接影响了居民的使用和房屋的质量。基于此,本文就卫生间防水施工质量控制展开研究,首先阐述了卫生间防水必要性,其次对卫生间发生渗漏的原因进行分析,最后提出了防水施工质控措施,希望能够防止卫生间漏水。
随着基于5G网络的触感网的迅速发展,触觉通信系统及遥操作技术受到了学术界及工业界的广泛关注。其中,人类在环的力反馈遥操作触觉通信系统是存在于触感网中的典型用例,它将代表人类主观感受的判断标准引入系统,称作用户体验质量(Quality of Experience,Qo E),以此反映系统性能。因此,在多个遥操作用户同时共享同一通信网络时,如何能够最大化网络总体用户体验质量成为目前一个主要的挑战。Qo
多目标优化问题是工程应用与科学研究的基本问题。处理该类问题的主要方法是进化计算。随着工业的发展,该问题的目标数量与问题规模都急剧增大。出于维数诅咒的原因,多目标进化算法在处理大规模超多目标优化问题时性能显著下降。因此大部分研究采用了分解策略以达到提升多目标优化算法性能的目的。针对分解策略仍存在的一些挑战,进行了改进。本文主要贡献如下:针对决策变量分析方法产生的分组结果不准确的问题,提出了一个统计变
深度神经网络(DNN)在包括计算机视觉,语音识别,自然语言处理,量子化学和医疗保健在内的多个研究领域中均表现出出色的性能。然而,众所周知,我们对其有效性的理论理解仍然不完整。深度学习架构需要通过标注大数据驱动的误差通过反向传播算法来不断优化“端到端”上的模型参数,这种学习过程犹如一个“黑盒子”。随着机器自动的黑盒算法开始辅助人类做出决策,这些机制有必要被更多的解释。此外,虽然这些大的神经网络用处广
在机器学习中,训练样本的数量与数据的准确性是除了模型之外对预测结果的准确性(也叫保真度)影响最大的因素。在很多实际问题中,例如计算机仿真问题,很多准确数据的计算成本是极高的,这种数据称为高保真度(High fidelity-HF)数据;而计算成本低、易获得,但准确度较低的数据称为低保真度(Low fidelity-LF)数据。利用这些多保真度数据建立的回归模型称为多保真度模型。多保真度建模致力于结
多智能体协同决策是人工智能领域的一个热门的研究方向,在实际生活中有着重要的作用。随着深度强化学习在单智能体领域的成功,越来越多的学者将其应用到多智能体协同决策任务。但是,由于环境的复杂性和动态性,多智能体强化学习算法在学习过程中可能面临着维度爆炸甚至无法收敛的问题。因此,如何通过智能体之间有效的通信,让智能体进行正确的行为决策,是多智能体领域的一个重要研究课题。为了实现智能体之间有效的通信,以加强
人工神经网络(ANN)作为强大的数据处理工具被广泛应用于:模式识别,控制,机器人技术,生物信息学等领域。它们的广泛适用性极大地鼓励了科研人员通过研究生物大脑来改善人工神经网络。在生物学上更合理的脉冲神经网络(SNN)更忠实地利用生物学特性来提供更高的处理能力。近些年,SNN在神经形态低功耗系统中获得更大的发展势头,现存的大多数脉冲监督学习方法都实现了较好的性能,取得极大的成功。但是,现有的SNN模
随着工业生产技术的提高,机器人越来越广泛的应用于人类的日常生产生活中。然而,机器人的生产水平受限于生产环境的变化难以实现柔性化生产。通过感知外在环境,机器人可以根据获取的信息来调整自身的姿态。因此,本文提出了一种基于智能感知与学习的机器人抓取与装配方法,并在此基础上设计了机器人抓取与装配系统,并利用实验进行了验证。主要内容包括以下几个方面:首先,在智能感知层面上,基于RGB-D图像构建了一种五维抓