【摘 要】
:
多人姿态估计是计算机视觉中的一个基础而又具挑战性的研究课题,可以广泛应用到高层视觉任务,如行为识别、行人再识别等。针对姿态估计普遍存在背景杂乱、人体被遮挡以及复杂多变姿态等情形,模拟人类的姿态估计机理,开展了人体相关信息补充的估计方法研究,并在COCO数据集上进行方法验证。具体研究工作如下:(1)基于全局信息能克服杂乱背景机理,提出了人体全局语义信息补充的估计方法。该方法基于注意力信息协同的旁路分
论文部分内容阅读
多人姿态估计是计算机视觉中的一个基础而又具挑战性的研究课题,可以广泛应用到高层视觉任务,如行为识别、行人再识别等。针对姿态估计普遍存在背景杂乱、人体被遮挡以及复杂多变姿态等情形,模拟人类的姿态估计机理,开展了人体相关信息补充的估计方法研究,并在COCO数据集上进行方法验证。具体研究工作如下:(1)基于全局信息能克服杂乱背景机理,提出了人体全局语义信息补充的估计方法。该方法基于注意力信息协同的旁路分支,为网络主干分支提供人体全局语义信息引导,抑制类似人体区域的背景响应,增强特征表达能力。消融实验、对比实验和可视化结果证明,利用人体全局语义信息有效地改善了杂乱背景图像的多人姿态估计。(2)基于语义信息和空间信息能克服遮挡机理,提出了人体语义信息和空间信息互补的估计方法。该方法以人体语义信息引导识别人体关键点,以人体空间信息引导加强人体关键点位置,并基于注意力进行二者的权衡,获得选择性信息互补特征表示。消融实验、对比实验和可视化结果表明,人体语义信息和空间信息互补可以提升人体被遮挡情形下的估计精度。(3)基于人体连接信息能区分多变姿态机理,提出了人体连接信息补充的估计方法。该方法利用人体关键点区域擦除提取人体局部连接信息;利用双向姿态知识转移补充人体全局连接信息,获得局部和全局结合的人体连接信息补充特征表示。消融实验、对比实验和可视化结果表明,人体连接信息补充显著提高了多变姿态估计性能。总之,人体全局语义信息补充、人体语义信息和空间信息相互补充以及人体局部和全局连接信息的相互补充可以较好解决复杂场景多人姿态估计,有效提升估计性能。
其他文献
目标跟踪技术在计算机视觉领域扮演至关重要的角色,应用范围十分广泛,比如应用在智能交通、工业检测、医疗等各个方面。目标跟踪技术即在缺少目标先验知识的前提下,在视频序列的第一帧中给定目标的位置和尺度后,确定后续视频序列中目标的位置与尺度。近几年的主流跟踪算法主要分为两类:基于深度学习的目标跟踪算法,利用深度卷积特征层作为特征提取方式,精度高,但是无法做到实时跟踪;基于相关滤波的跟踪算法,利用 HOG(
近年来,随着计算机视觉技术的飞速发展,目标检测,姿态估计,人脸识别,行为识别等一系列技术的研究都取得了非常大的进展,并且逐步运用到我们生活的方方面面,使我们的生活更加便捷。其中行为识别技术尤其有着广泛的应用场景,例如在智能监控、人机交互、视频检索、自动识别报警、公共安全等领域都扮演着重要角色。由于视频中的人体行为本身存在着高度的复杂性,再加上外界背景的干扰,拍摄相机的抖动等一系列问题,导致探索如何
近年来,我国的脑卒中患者正在不断增多,由于脑卒中具有高致残率的特点,导致大部分患者康复后还患有严重的运动功能障碍,但他们的大脑思维能力是正常的,因此有人提出利用脑机接口技术(Brain-computer Interface,BCI),将患者的真实运动意图转换成康复机器人等外部辅助设备的控制信号,帮助具有运动功能障碍的患者,为他们提供一个可替代的控制交流方式。本文主要研究的是BCI的核心,即脑电信号
通过2013年对公司法的修正,我国确立了注册资本完全认缴制。该制度之设立目的,在于通过降低公司设立门槛,进而刺激投资,提升市场活力,最终起到促进经济发展之作用。注册资本完全认缴制的目的不在于减轻公司股东的责任,而在于促进经济发展,且这两者既非同一概念,亦无因果逻辑关系。若无股东出资义务加速到期制度相配合,注册资本完全认缴制将为公司股东与公司债权人设置不平等不协调的权利义务关系,在该种失衡的权利义务
2019年最高人民法院发布的行政协议司法解释细化了行政协议纠纷的处理,由此引发了理论界和实务界的热烈讨论。关于国有土地使用权出让合同纠纷的处理,讨论的重点集中在行政协议性质的识别,以及与民事合同的区分,以期通过此种方式为出让合同纠纷的处理供给法律方案。诚然,厘清民事合同和行政协议的界限对国有土地使用权出让合同纠纷的处理具有重大的理论和实践意义,但此种研究方法忽略了该合同纠纷的特殊性,不能满足实践中
滚动轴承作为旋转机械中的基础部件之一,常常用于支持旋转部分,作用是降低设备在传动过程中的摩擦系数,同时滚动轴承也是高频的故障元件,滚动轴承质量的健康程度对机械设备的可靠运行的影响很大。滚动轴承作为旋转机械设备广泛应用于工业生产中,同时也是机械设备中较为薄弱的部件,因此,对滚动轴承进行故障诊断具有重要的意义。针对故障诊断的问题,本文以滚动轴承为研究对象,主要是从滚动轴承的故障特征提取和故障诊断这两个
随着机器人在各个领域的应用,视觉伺服技术的深入研究也被广泛关注。本文以无标定单目机器人为模型进行开展,在无需获取相机内参和外参的基础上,仅通过控制算法的设计和改进,实现视觉伺服控制。相对于标定的视觉伺服系统,不仅简化了操作步骤,更提高了控制算法的准确性和抗干扰能力,使视觉伺服系统对外界环境的变化更具鲁棒性。本文针对视觉伺服任务中可能存在的伪逆奇异性问题、图像噪声和标定误差干扰问题、特征点个数增多计
在航空发动机制造的诸多环节中,导管装配环节最为关键,是决定飞机飞行安全的重要因素。航空发动机的实际生产过程中,由于导管的实际位置与设计位置、法兰的实际位置与设计位置之间存在较大差异,发动机装配过程中需要工人反复不断地对导管进行修配和重制,这就导致装配效率低、精度差以及劳动强度大等问题。为解决以上问题提高装配质量,需要对航空发动机导管进行精准测量,这也是航空发动机导管智能装配必须突破的关键技术,具有
网络控制系统(NCSs)有着重要的研究意义和应用价值,受到广大学者的关注。然而,NCSs也是一类复杂的大型系统,实际中的很多被控对象和环节是高度非线性的。若采用一般的线性控制方法,无法满足实际系统对于性能方面的要求。同时,NCSs由于网络诱导因素不可避免的带来了网络时滞,数据丢包等问题,严重影响系统性能甚至导致系统不可用。耗散性理论在非线性系统的研究中起着重要作用,而无源性和QSR-耗散性是耗散性
教师身份认同在教师专业发展上占据重要地位。关于教师身份认同的研究吸引了很多学者注意。已有研究主要探讨了英语教师身份认同和专业发展的关系,以及教师身份认同构建的影响因素。在教师身份认同构建影响因素中,实习指导教师作为社会情境中重要他人的影响在职前英语教师身份认同中扮演着重要角色。然而,关于指导教师在职前英语教师身份认同构建中的作用的研究较少。因此本研究主要探索实习指导对职前英语教师身份认同构建的影响