【摘 要】
:
以人类动作分析为核心的视频分析技术是智能监控,图像/视频自动标注和智能人机交互等诸多领域中的重要技术,有着广泛的应用场景和研究价值。当前人类动作识别技术多集中在固定视角下的动作识别,然而,在现实应用中,摄像头在部署过程中会出现视角复杂多变的情况,在某些人与移动机器人交互的场景中,甚至可能出现相机不断移动的情况,这类型的问题在本文统一称之为自由视点动作识别问题。当前的工作大多只是在单一视角或者固定的
论文部分内容阅读
以人类动作分析为核心的视频分析技术是智能监控,图像/视频自动标注和智能人机交互等诸多领域中的重要技术,有着广泛的应用场景和研究价值。当前人类动作识别技术多集中在固定视角下的动作识别,然而,在现实应用中,摄像头在部署过程中会出现视角复杂多变的情况,在某些人与移动机器人交互的场景中,甚至可能出现相机不断移动的情况,这类型的问题在本文统一称之为自由视点动作识别问题。当前的工作大多只是在单一视角或者固定的多视角样本下进行了建模,而忽略了对移动视角样本的建模,并且,当前工作的模型大多直接由数据驱动,尝试从数据中挖掘不同视角样本下的共同动作类别模式,因此对数据集的数据量有着更大的需求。这些方法都没有考虑到对相机视点变化的建模。当前现存的大规模行为数据分析集只有固定视点(包括单视角和多视角)的样本,尚不存在移动视点的大规模数据集。为了验证本文算法的性能,在本研究工作中,采集了一个大规模的自由视点行为分析数据集,并且在开源社区进行了公开,具有较大的研究价值,可用于后续的一系列研究。本文为解决自由视角动作识别问题,设计了三种基于视角估计的自由视点动作识别模型。首先为了解决大尺度视角变化范围内的动作识别问题,本文设计了视角指引卷积网络模型(VG-CNN),该模型可以视为是预测样本的视角组,将其引入到动作识别模型中。通过这种隐式地利用了视角估计信息的方法,可以实现大尺度视角变化范围内的动作识别。本文为了解决人体活动过程中因自遮挡导致的噪声,进而引起的动作识别错误问题,设计了视角对注意力迁移网络模型(PairANT)。PairANT模型也可以视为隐式地利用了样本的视角标签,通过自注意机制去提取视角成对样本之间的共同特征,借助参考视角更为鲁棒的动作信息去指导自由视点样本进行自遮挡噪声的识别与屏蔽,以获得更鲁棒的多视角动作特征表达。本文为了显式地对自由视点进行估计,设计了基于人体姿态指引的Shift图卷积网络(PG-SGCN)。PG-SGCN模型通过视频人体动作捕捉技术,对RGB视频中的人体三维朝向信息进行了估计,并且通过将人体朝向信息引入到Shift-GCN模型中,实现了在不需要人工视角标注的情况下的自由视点动作识别理解。同时,在本文中还设计了一种分析不同视角和不同动作类别下,人体不同关节所带有动作决策信息量的方法,这种方法基于PG-SGCN注意力掩膜实现,可以为后续模型的改进提供一定的依据。
其他文献
作为最具代表性的Zn合金体系,超塑性Zn-Al合金以低流变应力、无加工硬化、高延伸率的特性可作为潜在的抗震材料。且该合金在室温高应变速率(10~500/s)下仍保持良好的塑性,延伸率达到30%。但由于双相组织的“老化”现象限制其进一步发展。近来细晶超塑性Zn-Mn和Zn-Ni-Mg合金展示了良好的高温超塑性。其中Mg元素添加可实现Zn合金的显著强化,Mn的添加可极大改善Zn合金的塑性。但对上述合金
带式输送机作为最重要的散状物料连续输送设备,广泛应用于矿山、港口、粮食和化工等领域,与汽车、铁路运输相比具有经济、高效、可靠、安全的优点。目前,有关带式输送机的进一步节能研究已经成为带式输送机研究的热点。压陷滚动阻力约占带式输送机总运行阻力的60%,因此,压陷滚动阻力计算方法的研究对带式输送机节能起着关键的作用。对带式输送机压陷滚动阻力的研究进展与粘弹性材料特性的测试方法进行了分析,借鉴Munze
随着物联网的发展,越来越多的设备将会接入到物联网中,海量的数据也会随之产生,将会需求巨大计算资源、存储空间和通信带宽。同时,实时性的要求也越来愈高。传统云计算框架已渐渐无法满足这些需求。作为云计算的扩展,雾计算被引入。雾计算部署在网络的边缘,接近于物联网设备和用户,能够有效减少云端的压力和实现更低的通信消耗。现有的大多数物联网应用为实现实时的监控和智能控制,需要云端的控制中心不断地从底层的物联网设
混凝土已经成为当今人类社会不可或缺的建筑材料,因其材料来源广泛、强度高等优点,在各种各样的工程中使用广泛。但是在实际使用过程中,它的韧性比较差,而且还比较容易产生裂缝,在混凝土中掺杂纤维材料能有效的改善这些问题。目前,在建筑工程中,为了提高混凝土的强度,使用的比较多的手段是将各种各样的纤维掺在混凝土中。为了研究纤维混凝土在地震作用下的振动特性,选用聚乙烯醇(PVA)纤维与钢纤维作为外掺纤维,采用振
随着科学技术的发展,每天都会产生海量视频数据,这些数据与我们生活有着紧密联系。如何有效利用这些数据为我们的生活带来便捷,是随之而来的问题。许多现实场景中,动作之间差异十分微小,使得它们具有细粒度的特征,所以细粒度视频行为检测和识别技术是一个有效解决问题的方向。细粒度动作识别和检测是一个非常具有挑战性的问题,近几年引起了学术界极大的关注。在视频中,细粒度动作类别之间的视觉差异非常细微,导致动作识别和
时序数据挖掘是数据挖掘和机器学习领域的一个研究热点,并被广泛应用于用户感兴趣位置实时推荐、金融系统风险评估预测和学者建档检索等实际应用中。与静态数据相比,时序数据不仅带有时间标签信息,还含有样本随时间动态演化的丰富信息。目前时序数据挖掘主要有两点不足:首先,大部分研究只关心每一个时刻数据的表征以及未来的状态,而数据的动态演化过程本身的建模与表征方面的研究存在很大空缺;其次,部分时序数据非常稀疏并且
随着云计算、大数据、区块链等技术的蓬勃发展,虚拟化技术也随之得到了广泛的应用,其中基于容器的虚拟化方案得到了更广泛的关注。Docker更是其中最热门的代表方案之一,但是Docker也面临许多安全性问题,由于直接使用了宿主机的内核与资源库,其隔离并不完善,诸多问题也因此发生。因此,增强Docker的隔离性迫在眉睫。本文专注于对Docker的隔离性问题进行了研究,主要研究内容包括以下三个部分。本文采用
野生动物监测系统作为野生动物保护的重要组成部分,对保护野生动物,维持生态系统的和谐稳定起着重要作用。我国已在多个省份的自然保护区大量布设红外相机构建野生动物监测系统。但是由于存在野生动物保护区通常没有通信网络以及红外相机易被误触发、数据回收难度较大等问题,野生动物监测系统无法及时获取监测设备拍摄的图像视频数据并且获取到的数据有大量无效信息,这就造成了监测系统运行人工成本高、实时性差等问题。本文设计
随着芯片的生产模式越来越依赖外包制造,其生产过程中的各个阶段都可能被植入硬件木马。硬件木马是芯片攻击中最有效的手段,引起了人们的广泛关注。硬件木马会导致芯片的物理场信息发生变化,因此本文针对芯片安全领域,分别研究了基于温度场效应的硬件木马实时监控技术和基于温度场特征的硬件木马精准修复技术,除此之外,还针对现场可编程门阵列(Field Programmable Gate Array,FPGA)的电压
水下主动电场成像是仿生弱电鱼建立电场探测周围环境的生物机制而诞生的一门新型水下成像技术。简易的电极传感器装置通过运动扫频的方式获取实验物体不同方向的频率转折点(FIP)信息,利用这些FIP能够实现对实验物体的轮廓成像。结构复杂的电极传感器阵列装置通过简单的运动扫描方式,测量扫描区域内不同位置的幅值变化信息,然后根据这些幅值变化信息同样能够对水下物体形状进行成像。本文对这两种水下主动电场成像方法进行