【摘 要】
:
人体姿态识别技术已经成为当今计算机视觉领域的重要研究内容,应用场景渗透到了日常生活中的方方面面。人体姿态识别(Human Pose Recognition)是指对数字图像或视频中人体关键部位和主要关节点进行识别,是人体动作识别和行为分析的基础与前提。人体姿态识别技术发展越来越快,但也面临着众多挑战。例如光照条件、背景复杂、人体自身遮挡和物体间遮挡等常见情况的发生阻碍着姿态识别研究的进展。基于深度学
论文部分内容阅读
人体姿态识别技术已经成为当今计算机视觉领域的重要研究内容,应用场景渗透到了日常生活中的方方面面。人体姿态识别(Human Pose Recognition)是指对数字图像或视频中人体关键部位和主要关节点进行识别,是人体动作识别和行为分析的基础与前提。人体姿态识别技术发展越来越快,但也面临着众多挑战。例如光照条件、背景复杂、人体自身遮挡和物体间遮挡等常见情况的发生阻碍着姿态识别研究的进展。基于深度学习的人体姿态识别因为其堆叠的卷积神经网络对大量数据集进行提取的特征具有高度抽象性与普适性,相较于传统的基于图像结构的方法有较好的泛化性与鲁棒性,应对光照条件差、背景复杂、人体部位遮挡等问题有较好的表现,但也存在模型结构复杂、模块相对冗余、实时性存在改进空间等面向实际应用的问题。因此,在自然环境下实现高精度且具有实时性的姿态识别仍面临巨大挑战。本文针对2D平面图像与视频中的人体姿态识别问题,提出了改进的OpenPose模型,更好地优化了精度与实时性之间的关系,充分地发挥了残差网络作为主干网络地优势,并通过观察关节点运动的规律,将关节点识别结果简单地应用于人体动作分类场景上,解决了自然图像中的人体姿态识别问题与自然视频中的人体动作分类问题。主要的研究内容概括如下:(1)提出了一种基于融合前层信息的人体姿态识别方法,在OpenPose基础模型上进行改进,用于解决自然图像中人体姿态识别过程实时性有待提高的问题。OpenPose基础模型存在着模型参数量大、难以训练的缺点,主要原因是受到主干网络VGG19网络参数量大的影响。本方法针对OpenPose基础模型实时性有待提高的问题,结合残差网络易于反向传播的特性,提出了使用ResNet网络作为主干网络、缩减阶段数的同时使用小卷积核代替大卷积核的方法,减小了参数量与计算量,提高了姿态估计中的实时性。首先,使用ResNet残差结构替代传统的VGG结构,能提高反向传播时的效率,加快模型的收敛速度。另外,在具体关节点识别的网络部分,裁剪了最后两个阶段,同时将剩余阶段内部的大卷积核使用级联的小卷积核替代,有效地缩减了计算量,提高了训练时的效率与预测时的实时性。在COCO数据集上的实验结果表明了相对于其他方法,本方法在解决姿态识别问题上有一定的精度保证,同时通过对比原始模型的预测时间,本方法在实时性问题上也有一定的提高。(2)提出了一种基于判别因子分类的人体动作识别方法,根据判别因子的不同取值进行站立、行走、靠近等场景的判别,用于实现简单的人体动作分类任务。基于深度学习技术实现的人体动作分类方法往往分类情形多、精度高,但也存在不足,例如模型复杂、部署麻烦等问题。本方法提出了一种采用经验值设定动作的分类准则,在获取人体关节点信息后,先进行一个多目标跟踪过程,获取各个目标的关节点轨迹,然后是根据关节点信息手动设计行为模板进行动作匹配。实现了从人体姿态识别到人体动作分类的一个简单应用。
其他文献
长期以来,太阳能热利用在其各种太阳能应用中所占比重最高,太阳能集热器作为热利用的重要载体,其结构设计和工作形式直接决定着太阳能热利用使用效率。直接吸收式集热器依靠
蒺藜苜蓿是豆科一年生草本植物,具有倍性小、基因组小、自花受粉及结种较多等特点。蒺藜苜蓿的植株再生时间较短,具有较高的遗传转化效率,因此其作为一种模式植物被国内外实验室广泛使用。豆科植物与根瘤菌形成的共生固氮系统是自然界重要的固氮方式之一,豆科植物供给根瘤菌碳水化合物,根瘤菌供给植物氮素养料,从而形成互利共生关系。其本质是一种极其复杂的分子对话行为,其中涉及到一系列豆科植物体内基因的调控表达过程,因
代驾服务过程中发生事故,这与普通类型的交通事故相比,受影响的主体更多,各方之间的法律关系更加复杂,加之缺乏法律的明确规定,代驾双方的法律关系界定不明确,难以确定侵权责任承担的主体,还会涉及到损害赔偿等与人身、财产利益息息关系的问题。为促进代驾行业健康有序的发展,本文将以有偿代驾和无偿代驾这两条主线展开讨论,明确各方的法律关系,为确定损害赔偿责任提供理论基础。具体来讲本文分为四个部分:第一部分主要分
为了描述两相界面的极限状态与运动过程,我们研究如下一类带有Neumann边界条件和初值条件的抛物型Allen-Cahn方程解的奇异极限问题,(?)这里Ω(?)Rn 是一个边界光滑的有界区域,v 是(?)Ω上的单位外法向量场.ε>0可表示两相交界面的宽度,uε表示在每点处的相位状态,W表示在±1处有双稳定点的势能函数.我们可以证明当初始时刻能量满足一致有界时,方程解的奇异极限会收敛到一个广义的
目前,随着光学技术的不断发展和应用领域的不断拓展,纳米发光材料是功能材料的研究热点之一。纳米稀土含氧酸盐材料的种类众多,例如稀土磷酸盐材料、稀土钛酸盐、稀土钒酸盐
首先,本文中所涉及到的图均为简单图。对于一个平面图G,让V(G)表示图G中所有点的集合,E(G)表示图G中所有边的集合和F(G)表示所有图G中面的集合。如果存在G的点集到颜色集的一
目的:本研究旨在观察恩替卡韦联合逍遥散加减治疗e抗原阳性肝郁脾虚型慢性乙型肝炎的有效性、安全性,评估其临床疗效,以便为临床治疗慢性乙型肝炎疾病提供诊疗依据,提高诊治
目的中性红是一种碱性吩嗪染料,由于其结构中存在氧化还原中心,因而可作为一种良好的媒介体使用。本论文以电聚合法制备聚中性红修饰玻碳电极(GCE),并以此修饰电极为电化学探
表面活性剂囊泡凝胶作为一种重要的材料,由于其具有凝胶和囊泡的双重优点,因此近年来备受关注。在已研究的有限的表面活性剂体系中,已经得到了球形囊泡凝胶,但多面体囊泡凝胶
井地电磁法是指井中供电,在地面接收电磁场的一种探测方法。在油气勘探开发过程中,井地电磁测井可用于圈定油藏边界和勘探剩余油气等工作。随着近年来非常规油气勘探开发工作的深入,如何在复杂的各向异性地层中开展井地电磁测井工作是一项新的挑战,而针对各向异性地层中的井地电磁正演问题开展研究工作可为这一应用提供重要的理论依据。本文首先采用解析方法对垂直电偶源在各向异性地层的井地测井正演响应进行理论推导,得到频率