【摘 要】
:
观察和理解他人行为是正常人类生活中的一项基本技能,同时,现代人类心理学的一个重要的研究分支就是观察人类的动作行为并进行分析。动作识别是健康监测、人机交互、机器人以及其他很多应用的基础技术,一直以来都受到研究人员的广泛关注。该方向不仅拥有重要的理论研究价值,还有着广泛的应用前景。研究表明,多模态信息融合的方法可以提高人体动作识别准确性。因此,在动作识别中,充分获取和高效利用多模态动作数据中的特征信息
【基金项目】
:
国家自然科学基金(No.61876042)基于子空间学习的多视图鲁棒一致性表达研究;
论文部分内容阅读
观察和理解他人行为是正常人类生活中的一项基本技能,同时,现代人类心理学的一个重要的研究分支就是观察人类的动作行为并进行分析。动作识别是健康监测、人机交互、机器人以及其他很多应用的基础技术,一直以来都受到研究人员的广泛关注。该方向不仅拥有重要的理论研究价值,还有着广泛的应用前景。研究表明,多模态信息融合的方法可以提高人体动作识别准确性。因此,在动作识别中,充分获取和高效利用多模态动作数据中的特征信息非常重要,这有利于我们将模型应用到实际生活中。但是,如何快速而有效地获取多模态动作信息的内在联系来进行高效学习是一项具有挑战性的工作。本论文依托于国家自然科学基金《基于子空间学习的多视图鲁棒一致性表达研究》,分别研究了基于骨架序列的动作识别、基于骨架序列和RGB视频多模态信息的动作识别问题。首先,本文提出一种使用骨架联合距离特征结合三尺度运动信息的极其轻量级的神经网络模型,来高效地实现基于骨架的动作识别。本文使用骨架的联合距离特征并充分利用多尺度运动信息,有效地对动作数据进行编码。还使用深度可分离卷积块,用于有效地从骨架数据中学习语义特征。本文还利用Dropout层随机丢弃不同尺度的运动信息,从而可以实现自适应地提取多尺度的运动特征。本文在SHREC、JHMDB、NTU-RGBD三个数据集上对提出的模型进行了实验对照,实验结果证明了模型的有效性。通过使用轻量化的网络结构,模型能够在单个CPU/GPU上以超快的速度执行动作识别。其次,本文从通道注意力机制出发,采用了一种高效的通道注意力机制并用于多模态信息学习中,提出了基于高效通道注意力机制的多模态动作识别网络。在多模态信息融合的中间阶段,视频和骨架两个模态的特征信息在不降低维度的情况下进行逐通道全局平均池化,然后,本文通过捕获每个通道特征及其k个近邻的通道特征来获得特征信息的跨通道交互。然后,本文利用这种融合机制在视频模态预训练模型和骨架模态预训练模型进行中间层融合,并随后将两个模态分支最终的输出特征的输入到视频-骨架门控信息融合模块中,进行分类。本文在两个流行的大型多模态动作识别数据集中进行了测试,在NTU-RGBD和UTD-MHAD数据集中都达到了较好的效果,证明了本文所提出的基于高效通道注意力机制的多模态动作识别网络,有效地融合了骨架特征和视频特征,并显著提高了多模态人体动作识别的准确率。本文在多个动作识别数据集对上述的两个网络模型进行了充分而有效的实验,证明了网络模型的有效性。
其他文献
五育并举教育理念是素质教育背景下全面推进教育改革的新理念,除了推进教学工作改革,还需要对班级管理工作进行改革。在教育发展进入新时期之后,班主任肩负的责任越来越重。传统的班级管理理念缺少民主意识和对学生健康成长的考量,班级管理工作效果并不理想,不符合素质教育的要求,与五育并举教育理念相违背,迫切需要对班主任班级管理方法进行改革创新。本文将立足五育并举教育理念的要求,结合五育并举教育理念对于开展班级管
“五育”并举教育理念立足于我国中小学生的德智体美劳全面发展目标,逐步提升素质教育质量,是引领我国中小学教育改革的重要方向。在“五育”并举中,德育为核心,智育为重心,体育为保障,美育为提升,劳动教育则是素质教育的重要体现。班级管理中的“五育”并举,是协助初中生度过青春期的关键教学手段。本文将着重分析“五育”并举理念在初中班级管理中的实践要点,旨在提升班级管理效率。
伴随着我国经济水平的快速发展,行行业业对电力系统的稳定运行提出了更高的需求。一旦发生停电,将会给人们生活带来巨大的损失。然而,在广东沿海丘陵地区由于良好的地理环境和生态气候导致鸟害引发的输电线路故障频发,输电线路的安全受到了严重的威胁。输电线路分布范围广,而且与鸟类活动有关的因素并不是唯一的、固定的。鸟类的危害范围也会因生态环境的变化而每年发生变化,盲目的人工驱鸟很难达到有效防止鸟害的作用。因此,
本文将借助随机矩阵理论这个强大的数学工具对有限维度的混合对称系综展开研究。本文沿着推导出有限维混合对称系综的新结论并将其应用到各类场景的研究思路开展了以下的研究,主要分为三部分:第一部分是混合对称系综的特征值联合分布统一形式的建立。本文先提出了一个关于混合对称系综的排序特征值联合概率密度函数的统一表达式,然后详细推导了拉盖尔酉系综(Laguerre Unitary Ensemble,LUE)与拉盖
传感器技术的快速发展,使得人们能够在计算机视觉、神经科学、信号处理等领域中获取大规模、多维度的数据。然而,由于设备故障、网络延迟、外物遮掩等客观因素,获取到的数据通常是不完整的(仅部分元素可见),传统的设备和算法往往无法有效处理不完整的数据。所以,越来越多的研究人员关注如何利用仅有的部分数据来恢复出完整张量。除此之外,数据在收集过程中,还通常混杂高斯噪声或椒盐噪声。克服不完整、噪声的干扰,实现数据
在数字化时代,每个用户的身份和行为均可用数字来量化,而其数字背后蕴藏着无数的商业价值。各大平台将依据量化的数字,来精准地为用户投放能够吸引用户观看的内容,或者用户感兴趣的广告,良好的点击率不仅会给平台方带来可观的收益,而且会给用户带来舒适的使用体验。因此,关于点击率预估的研究具有重要的意义。首先,论文叙述并分析了两种主流点击率预估模型的结构和优缺点,并在此基础上提出了一种新型的融合模型。论文对主流
缺陷检测方法作为一种图像视觉检测任务的实现方式,是工业产品生产流程中进行质量把控的一种重要方法。随着视觉检测技术的发展,缺陷检测方法取得了一些进展。但是工业产品表面缺陷检测方法仍然存在一些待解决的问题。例如,工业产品表面的图案样式复杂以及产品缺陷的尺度具有多样性,导致现有的缺陷检测方法存在检测精度不高的问题。此外,由于工业生产过程中新产品的更新速度快,因此难以收集和制作足量的缺陷图像数据集以供视觉
复杂网络是由大量节点组成的网络,这些节点之间存在一定的联系。在日常生活中,复杂网络的例子随处可见,比如,电网、万维网(WWW)、航线网和疾病传播网。小世界网络和无标度网络的发现使复杂网络的研究取得了引人注目的进展,同步、状态估计等问题也随之引起了研究者们的极大研究兴趣。由于复杂网络中的节点通常分布在不同地点,因此需要利用通信网络进行数据传输。由数据传输引起的各种问题(包括采样、网络攻击等)会导致节
近年来,随着中海油海上平台采用陆地电网供电的方案逐步实施,海上平台的电能质量被逐渐引起关注。采用岸电供电与自发电系统有很大不同,接入陆地电网后海上平台必须要满足地方电网的电能质量要求。但海上平台生产中的大量非线性设备,影响供电系统的供电电能质量,对电网造成电压波动及谐波注入,因此必须对海上平台电能质量进行评估并进行针对性的治理。以岸电平台谐波的仿真分析计算为例,给出谐波分析计算结果及谐波治理方案。