【摘 要】
:
如今大数据存在于生活中的方方面面,对各种形式的海量数据进行合理应用,无论对于个人还是企业,都能带来可观的收益。视频数据作为这些海量数据中的主要部分,应用领域涉及生活中的各种场景,例如运动分析、医疗康复以及安全监控等。但现有技术对于视频中的人体行为识别问题的处理仍存在一些不足之处,这个领域仍然需要进行更加深入的研究。本文对于视频中的人体行为进行识别,主要分为两步,一是获取人体三维姿态特征信息,二是利
论文部分内容阅读
如今大数据存在于生活中的方方面面,对各种形式的海量数据进行合理应用,无论对于个人还是企业,都能带来可观的收益。视频数据作为这些海量数据中的主要部分,应用领域涉及生活中的各种场景,例如运动分析、医疗康复以及安全监控等。但现有技术对于视频中的人体行为识别问题的处理仍存在一些不足之处,这个领域仍然需要进行更加深入的研究。本文对于视频中的人体行为进行识别,主要分为两步,一是获取人体三维姿态特征信息,二是利用已获得的姿态信息对人体行为进行分类。以往的研究对于人体行为分类主要是基于外表特征或是光流特征来进行行为分类,往往忽视了人体骨骼信息在空间和时间上蕴含着的丰富的特征信息。随着人体姿态估计技术的不断进步,直接从视频获取准确的人体骨骼序列已经变得越来越容易,同时具有很高的精度,为人体行为识别提供了新的分析数据;而且随着近几年关于图卷积神经网络研究的不断完善,以图神经网络为主处理人体骨骼序列,辅以注意力机制增强模型效果,已经逐渐成为人体行为识别领域的主流方案之一,对于视频中的人体行为的分类有着很高的准确性,本文的研究就是基于这类方案。本文主要研究成果如下:(1)为了进行基于骨骼序列的人体行为识别的研究,首先要保证能够准确获取人体姿态信息,本文选择三维人体姿态估计作为研究方向,基于已有的二维人体姿态估计技术,设计了一种基于空洞时序卷积的空时卷积模型,利用时序空洞卷积提取二维姿态的帧间关联信息,该模型可以通过堆叠空洞空时卷积模块,调节每个模块相应的空洞卷积率,来逐步扩大模型在时间维度上的感受野大小,获取更多的时序信息;同时由于空洞卷积的特性,网络模型的参数量不会随着网络深度的增加而大幅度增长,保证模型在提高预测准确度的同时不会大量占用计算资源;此外我们还在每个模块中建立并调整残差结构,在将不同尺度的时序特征引入网络同时,保证了模型训练的鲁棒性;最后,我们在Human3.6M数据集上进行了实验,取得了和现有同类前沿工作的相媲美的效果,证明了本文理论的正确性。(2)在进行三维人体姿态估计的研究时,我们发现对于该类问题,甚至是对于所有基于深度学习算法来说,缺少大量高质量标注的数据集这一问题严重限制了相应研究的推进。在研究过程中,本文发现三维姿态估计问题中的特征分布非常符合半监督学习的三大基本假设,即平滑假设、聚类假设和流形假设,因此半监督学习适用于三位人体姿态估计任务。于是本文设计了一种半监督学习策略,首先通过少量标记数据学习进行监督训练三维姿态的特征分布,随后用训练好的模型处理大量无标记数据的到相应的三维姿态,将三维姿态重新投影到二维空间并进行相应处理后得到伪标签,利用伪标签完成无监督训练,充分发挥无监督学习的正则化作用,增强监督学习的效果,并在Human3.6M数据集上与监督学习的结果进行了比较,证明了半监督学习的价值。(3)本文在ST-GCN网络的基础上,增加了利用人体部件向量的部件分支网络,引入骨骼高阶信息,提高了网络的准确性;此外,本文还发现ST-GCN的注意力机制存在明显缺陷,其注意力机制只关注相邻关节点间的联系,完全忽视相距较远的节点间的联系,只关注了节点附近的局部特征,缺乏对于全局运动特征的关注,而在人体行为识别中,长距离关节点之间的关系具有非常重要的作用,仅仅凭借相邻关节点的关联无法准确判断多数行为的分类。为了在注意力机制中引入全局运动特征,本文参照非局部均值滤波算法建立非局部模块,引入全局特征;此外,为了区分所有节点关联的重要性,本文再建立了一个注意力掩模矩阵用于学习各个边的重要性,最后在Kinetics-Skeleton和NTU-RGBD两个数据集上进行了实验,取得了与主流工作相媲美的结果,证明了算法的正确性。
其他文献
目的:编制居家失能老年人家庭抗逆力量表(Family Resilience Scale,FRS),使用其评价新疆少数民族地区居家失能老年人家庭抗逆力现状并分析影响因素,探究关键因素对家庭抗逆力的作用途径,以期为下一步开展本土化居家失能老年人家庭抗逆力研究提供科学基础。方法:(1)文献研究:了解失能老年人家庭抗逆力研究现状,初步构建家庭抗逆力一级、二级指标;(2)半结构式访谈:挖掘居家失能老年人家庭
细胞周期检验点是真核细胞内调节细胞周期各个时期转换有序进行的重要调控机制,主要包括DNA损伤检验点、DNA复制检验点和纺锤体检验点等细胞周期检验点。检验点缺陷会导致基因组的不稳定性及最终癌变的发生。蛋白质的磷酸化是一种普遍存在的调节机制,它控制着许过细胞的活动。异常的蛋白质磷酸化与许多人类疾病包括痛症的发生相关,它可能是由于蛋白质的磷酸化作用失调引起的。PPM1G属于蛋白磷酸酶PP2C家族,PPM
羊肉美味独特,富含营养,深受食用者的欢迎。非冻结储运模式下的冷鲜羊肉最大限度地保留了肉品原有口感和营养,逐渐成为肉品消费市场的主流,然而冷鲜羊肉在贮运过程中易受微生物等影响导致新鲜度下降速率快、货架期短。新鲜度作为衡量羊肉经济价值和食用性的重要标准,对新鲜度的精确检测既可以维护消费者权益、保障食用安全,也能够加强对食品监督部门的监管。传统的肉类新鲜度检测方法已经不能满足羊肉流通中快速无损检测的需要
干旱的发生会对工农业的正常运行以及社会发展起到极大的限制,充分了解干旱的成因、变化规律及影响因素对预防干旱发生、缓解旱情有重大作用。构建合理、适宜的水文干旱指数可以量化干旱的特征以及变化趋势,便于人们对干旱的研究与预防。近年来,人类活动对干旱的影响不断加大,分析人类活动下土地利用/覆被变化对干旱的影响,对于了解干旱、抑制干旱、预测干旱意义重大。本文选用四种分布函数对寨上、兰村站1958-2000年
抗滑磨耗层是一种能快速提高路面抗滑性能的预防性养护技术,本文针对聚氨酯类超薄磨耗层的抗滑性能和耐磨性能以及抗滑衰变规律进行系统性的研究。研究填料种类对聚氨酯物理性能的影响以及树脂用量、铺装工艺和防滑粒料的种类、粒径对超薄磨耗层抗滑性能的影响,采用国际摩擦指数IFI、回归拟合分析法和灰色关联分析法来评价其抗滑性能和耐磨性能,基于分子动力学技术对聚氨酯树脂与防滑粒料的界面相互作用进行研究。聚氨酯超薄磨
海藻酸钠是一种被广泛研究并用于组织工程、药物输送等生物医学领域的天然阴离子多糖,但其自身存在稳定性差、耐水性不足以及无法负载疏水性药物等问题,应用过程中往往需要对其进行改性,通过化学改性可以改变海藻酸钠的亲疏水性质并赋予其新的特性。静电纺丝是制备比表面积大、孔隙率高的纳米纤维的有效技术,将海藻酸钠制备成纳米纤维可在生物医药方面发挥很大的作用,但由于海藻酸钠的刚性其静电纺丝仍存在一定的挑战。本文基于
高精度的地表温度(Land Surface Temperature)产品具有广泛的应用场景,对林业养殖、农业耕种、气象预报、城市热岛研究等领域有着深远意义。传统的地面观测难以获取大范围的地表温度,并且在时序上无法连续,因此不能反映真实的地表温度时空分布状况。遥感技术的飞速发展使得热红外遥感为获取大范围地表温度信息提供了新的途径。国产环境一号卫星(HJ-1B)热红外通道数据时间分辨率高,易获取,为我
《乙瑛碑》点画的临写任何书体的基本笔画皆有点画。点画是字之眉目,全藉顾盼精神,故隶书中的"点"虽属平画,但也有向背,随字赋形。《乙瑛碑》中点画变化丰富、形态多样,它是其它笔画的浓缩,主要有正点、横点、竖点等多种。临写时须用心体会,仔细观察,切实做到精准临写。1.正点。逆锋向上起笔,再向右下顿笔,然后转锋向左下方行笔,最后提笔出锋。书写时要做到一笔完成。如"守、空"等字。
新疆棉花及其制品因具有较高的使用价值和良好的经济效益,棉农种植积极性强,使新疆棉花种植面积和单位面积产量在我国棉花种植各省市中均居首位。其中,播种质量是影响棉花单位面积生产率的重要因素之一。针对集排式排种器田间受迫振动、棉种颗粒运移稳定性差等问题,采用提高集排器投种高度、增加辅助投种的吹种正压、成穴器破膜播种作业等方式,设计了一种能够和新疆膜上穴播工艺相适应的集排式棉花播种机排种运移系统,确定了集
目的:探究新疆石河子市3240例HPV和TCT双筛异常行阴道镜活检者的宫颈病变特点,为临床工作提供指导。方法:收集2017年5月~2019年3月在石河子大学医学院第一附属医院妇科门诊行宫颈脱落细胞液基细胞学(Thinprep Cytologic Test,TCT)和人乳头状病毒(human papilloma virus,HPV)检测,结果异常转诊行阴道镜下子宫颈组织活检的3240例患者的临床病理