【摘 要】
:
随着计算机视觉领域的快速发展,近年来,基于图片和视频的3D人体姿态估计吸引了越来越多人的注意。与2D人体骨架相比,3D人体骨架由于具有旋转不变性,在动作分类上可以取得更好的效果。因此,做好3D姿态估计将会极大的推动动作分类领域的发展。然而,据我们所知,大多数工作解决的是在控制环境下的单人3D姿态估计问题。因此,在自然条件下解决多人3D姿态估计问题有着重要的应用价值。我们提出了基于视频的多人3D姿态
论文部分内容阅读
随着计算机视觉领域的快速发展,近年来,基于图片和视频的3D人体姿态估计吸引了越来越多人的注意。与2D人体骨架相比,3D人体骨架由于具有旋转不变性,在动作分类上可以取得更好的效果。因此,做好3D姿态估计将会极大的推动动作分类领域的发展。然而,据我们所知,大多数工作解决的是在控制环境下的单人3D姿态估计问题。因此,在自然条件下解决多人3D姿态估计问题有着重要的应用价值。我们提出了基于视频的多人3D姿态估计方法,主要包括以下三个步骤:(1)在整个视频中,检测出每个人每一帧的2D姿态;(2)在整个视频中对每个人进行追踪,并把他对应的2D姿态提取出来并与这个人相匹配;(3)通过预先学习的基元姿态并且考虑到视频中时间上的平滑性问题,我们用设计的算法来重构每个人在整个视频中每一帧的3D姿态。通过提出这个框架来解决多人3D姿态估计问题,也是本文最大的创新点。我们在公开的数据集Human 3.6M和自己拍摄的多人视频上测试了我们的算法。在公开数据集Human 3.6M上的定量结果表明了我们的算法优于一些state-of-art算法。在我们自己拍摄视频上的定性结果也表明了我们方法的有效性。
其他文献
在工业物联网环境中部署大量边缘设备以构建边缘网络架构已成为一种趋势。越来越多的工厂选择这种方法来提高生产效率。边缘网络的优点是通过利用雾节点的快速响应能力来提高实时系统的抗干扰能力,降低系统服务总体延迟。但是雾节点的有限资源不足以配置所有传感器节点必需的服务。雾节点的自适应配置必须跟踪工业设备需求的变化,最大程度地减少延迟,并在满足约束条件的同时确保系统稳定性。本文研究了在恶劣和复杂的网络条件下,
把物体辐射的红外线特征转换为电信号再以可见光图像的形式展现出来的热图像就是红外图像。红外线相比于可见光具有穿透力强,稳定性好,测距远,可以夜间成像等特点,所以红外图像应用广泛,红外目标的检测跟踪问题备受关注。本研究中的红外目标总体来说有三大特点。第一个特点是目标所处的背景比较复杂。云层、海杂波、戈壁滩、山脉等复杂背景中的杂波、干扰给目标检测带来很大的困难。第二个特点是多数目标面积相对较小,即使面积
传统的时频分析方法是处理非平稳信号的有力工具,它可以同时描述信号的时域和频域特征,由于Heisenberg测不准原理影响,短时傅里叶变换和小波变换的时频表示能量聚集性较差,又因交叉项干扰,使Wigner-Ville分布难以处理多分量信号,为此本文主要研究基于短时傅里叶变换的一类时频后处理方法,即同步变换方法。同步变换通过估计信号的瞬时频率或群延迟信息,将短时傅里叶变换的时频系数进行同步压缩或同步提
静态随机存取存储器(static random access memory,SRAM)作为高速缓存(cache),是芯片上不可或缺的组件。随着芯片技术的不断发展,SRAM的容量不断增加,其占据的片上面积不断增多。另一方面,随着半导体器件的特征尺寸不断减小,工艺扰动导致SRAM的良率下降,严重降低芯片的可靠性。因此提高SRAM的密度和良率对降低芯片的面积和提高芯片的可靠性至关重要。近年来,碳纳米场效
世界上有数百万的聋哑人,他们不能像常人一样通过语言进行沟通,而是通过手语进行沟通交流,这给生活带来了诸多不便。因此,开发一套可以让常人理解他们的手语实时识别系统是非常有意义且有价值的。在本文中,我们研究了一套中国手语实时识别系统,该系统可以识别聋哑人的中国手语,并实时地通过文字与语音的形式将识别结果输出给用户。首先,我们创建一个中国手语数据集。依照国家通用手语常用词汇表,使用RGB摄像头采集了日常
目前,精益生产是最热门的生产方法之一,许多飞机制造商在其生产系统中都采用了精益原理。与此同时,互联网技术也在航空业中广泛应用。本文提出了将精益和物联网这两种方法集成以用于提高航空企业的竞争力。在将此概念应用于企业实际生产前,有必要对过程进行模拟并分析结果。本文将使用离散事件仿真来验证这些技术的效果。由于ARENA软件非常适合此研究,因此本文应用其实现建模。最后,本文得出的结论是,应该以集成的方式使
随着智能物联网时代的到来,大量基于目标跟踪或定位的服务日益增多,尤其在一些特定的室内场景下,例如监狱看守、养老院老人监护、自动化仓库设备等封闭的室内环境,众多服务需求都依赖于精确的目标跟踪与定位。现有室内定位方案即使定位精度已经可以达到不错的分米级,但是在一些复杂场景中,其精度仍然不高。而近几年来,视觉目标跟踪发展迅速,图像跟踪精度高达像素级别,但可靠性较差。本文的研究工作即同时结合了视觉目标跟踪
在企业的日常经营过程中,运用全面预算管理能够有效地改善企业内部控制管理,扩大企业的经济效益。因此,作为一种科学完整的管理体系,全面预算管理在企业实践中已经得到广泛的认可。但是,由于全面预算管理在我国企业的实践时间还比较短,目前仍然存在比较多的困境,亟须加以完善。本文介绍了企业实施全面预算管理的现实意义,分析了全面预算管理在实践过程中面临的主要问题,并据此提出具有针对性的对策建议,以期促进企业战略目
随着制造业向数字化、智能化的转型升级,企业间的竞争日趋激烈。在这样的背景下,在产品生产的早期阶段进行快速准确的报价是必不可少的。在制造业转型升级的过程中,CAD模型已经成为了贯穿整个生产周期的信息载体,这些蕴含了丰富信息的CAD模型成为了可以利用的珍贵资源。针对这一背景,本文设计了一种以零件的中性格式(.stp)B-rep模型文件作为输入的报价系统,并利用python OCC作为几何内核完成了系统
随着时代的发展、大数据的普及,人类所掌握的数据量也日益增长,而数据结构作为计算机存储、组织数据的方式,也随着新时代的发展不断推陈出新,其中双向映射数据结构作为一类重要的数据结构,被广泛用于一类双向映射数据集的存储、检索应用场景,如数据重映射优化、DNS(Domain Name System)等应用场景。资源描述框架(RDF)作为新时代的数据模型,通常用于描述Web资源的特性、资源之间的关系,已经被