【摘 要】
:
视频动作识别作为视频理解的主要研究任务之一,在智能监控、自动驾驶、人机交互等领域有着广泛的应用。近年来,随着深度学习技术的发展,视频动作识别取得了很多突破性的进展。但由于视频不同于图像,由很多连续的帧组成,且序列信息存在很大的冗余性,因此如何对视频帧间的关系进行充分建模、如何选择视频中的关键信息以降低冗余并抑制噪声,以及如何对视频中不同尺度的序列关系进行充分挖掘都十分关键。本文分别针对上述三个方面
论文部分内容阅读
视频动作识别作为视频理解的主要研究任务之一,在智能监控、自动驾驶、人机交互等领域有着广泛的应用。近年来,随着深度学习技术的发展,视频动作识别取得了很多突破性的进展。但由于视频不同于图像,由很多连续的帧组成,且序列信息存在很大的冗余性,因此如何对视频帧间的关系进行充分建模、如何选择视频中的关键信息以降低冗余并抑制噪声,以及如何对视频中不同尺度的序列关系进行充分挖掘都十分关键。本文分别针对上述三个方面的问题,提出了三种高效的算法机制,并将其进行有机结合构建了基于金字塔时空图网络的视频动作识别模型,对现有方法进行改进。三种算法机制之间是互补的关系,具体如下:1、基于图卷积网络的长距离时空关系建模。针对现有模型仅使用卷积等局部操作来提取帧的特征,无法对视频帧与帧之间的长距离时空关系进行有效建模的问题。本文提出在视频序列的时间以及时空维度分别构建图卷积网络来对视频帧与帧之间、帧内及跨帧各区域之间的长距离时空关系进行建模,从而得到更有利于分类的动作表征。实验表明,将提出的方法在大规模动作识别数据集上与多个基准模型相结合,可获得显著的性能提升,证明了图卷积网络在视频动作识别任务中用于长距离时空关系建模的有效性。2、基于时空注意力机制的关键特征选择。针对现有模型对视频所有输入帧均给予相同的权重,无法对重要信息进行筛选,使得模型容易受到无关信息的干扰并造成信息冗余的问题。本文提出时间以及时空注意力模块,在时间以及时空维度上促使网络分别对动作分类重要的帧以及时空区域给予较大的关注。实验表明,提出的注意力模块使得网络更加关注对动作识别重要的特征,从而避免了噪声干扰与信息冗余,有效提升模型性能。3、基于多尺度特征金字塔的特征融合。针对单尺度模型感受野单一,无法对视频序列中不同尺度的特征关系进行充分挖掘和融合的问题。本文提出在视频序列上构建多尺度特征金字塔的方法,依据上述提出的注意力模块给予每帧及每个时空区域的不同权重,多次选择不同数量的重要特征在时间及时空维度得到多尺度的特征组合,并对其进行融合来进一步提升模型的特征理解能力。在多个大规模视频动作识别数据集上的大量实验表明,该方法可以有效地增大网络的感受野,对不同尺度的关键特征进行充分融合,进一步提升模型性能。
其他文献
目的 探讨瑞芬太尼和七氟烷复合麻醉在老年患者腹腔镜手术中的麻醉效果。方法 选择2021年1月—2022年12月在菏泽医学专科学校附属医院实施腹腔镜手术的老年患者60例(年龄> 60岁)为研究对象,随机分为对照组和观察组,每组各30例。对照组采用全凭静脉麻醉瑞芬太尼靶控输注,观察组采用静吸复合麻醉瑞芬太尼靶控输注联合七氟烷吸入。比较两组拔管后1、3 h时短期定向力-记忆力-注意力测试(short o
国土面积排名世界第九的哈萨克斯坦是世界上最大的内陆国(面积为272万平方公里,2021年全国人口达到1900万人。哈萨克斯坦的土地矿产和自然资源非常丰富,采矿业是国加最具竞争力的行业之一,1999年后进入稳定增长的轨道,主要是由于外国投资参与了该经济部门的发展。哈萨克斯坦的采矿业在独联体国家中仅次于俄罗斯,位居第二。由于其优越的地理位置,哈萨克斯坦拥有大量的黄金、钨、铜、铅和锌储量,油气储量达到3
相比于普通RGB图像,高光谱成像系统可以记录目标场景中几十到上百个光谱波段的信息,这些丰富的信息在遥感、农业、医学等研究领域都具有广阔的应用前景,但是高光谱成像系统在捕获光谱信息的同时也引入了极大的额外复杂度,其昂贵的价格限制了高光谱图像在各个领域的应用与发展。近年来,从RGB图像中进行光谱重建作为一种低成本快速获取高光谱图像的方法成为当下的研究热点。基于深度学习的RGB光谱重建方法取得了比较显著
在铁轨服役过程中,长期磨损会导致多类型缺陷产生,包括滚动接触疲劳裂纹、掉块、内部核伤等。因此,对铁轨进行巡检是保证列车安全运行的必要手段。电磁热成像物理上耦合电磁和热效应,能同时自动化检测表面与亚表面缺陷,是铁轨近表面巡检的有效技术之一。目前常用于电磁热成像铁轨缺陷检测的目标检测算法性能较大程度取决于缺陷训练数据集的丰富性,无法充分利用无需标注且易获取的背景样本,因此基于监督学习的铁轨缺陷检测算法
近年来,生态环境保护日益受到重视,大数据建设发展迅速。强有力的环境科技是持续改善生态环境、建设生态文明、打造美丽中国的重要依据。环境监测是生态环境保护各项工作开展的基础,充分运用大数据、云计算等现代科技手段,进行生态环境监测大数据质量监管和分析。将大数据技术应用在环境监测与管理工作中,开展水环境污染分析溯源、预判水环境敏感点及水环境质量的预测预警等更具有现实意义。
目的 探讨姜黄素对七氟烷致老年大鼠认知功能障碍及海马神经细胞凋亡的改善作用及可能的作用机制。方法 选取48只SD雄性大鼠建立术后认知功能障碍(postoperative cognitive dysfunction, POCD)模型,将建模成功的大鼠随机分为模型组(12只)、姜黄素低剂量组(12只)和姜黄素高剂量组(12只),另设对照组(12只)。姜黄素低、中、高剂量组分别用50、150、300 m
在航空航天、轨道交通、军事、管道输送等领域,很多材料都会产生近表面亚表面缺陷,需要无损检测及时修复。如碳纤维复合材料脱粘、分层等缺陷会导致结构整体失效;涂层材料的裂纹、脱粘等缺陷会影响隐身性能;玻璃纤维材料脱粘、空洞等缺陷会导致结构刚度和强度下降,保护性能和隔热性能不达标。这些问题都可能导致安全事故发生。光激励红外无损检测技术适用于大多数材料的近表面和亚表面缺陷检测,且具有无接触、快速直观成像的优
截瘫助行外骨骼机器人在康复医疗领域的作用日益突出,为了保证患者使用外骨骼过程中的安全,外骨骼人机系统的平衡成为一大研究热点。要保持平衡的首要目标就是判别和量化平衡,即需要一个可靠的平衡指标。过去对人体和机器人的平衡指标研究较多,但对外骨骼人机系统的平衡指标研究不足。因此本文针对外骨骼人机系统,分别提出了两种平衡指标。一种是基于改进稳定锥的平衡指标,在最小稳定角大于零的情况下效果良好;另一种是基于质
钛白粉因优良的颜料性能在涂料工业中应用广泛。表面处理对钛白粉的性能具有关键性的作用,其后处理工艺决定着钛白粉的分散稳定性及颜料应用综合性能。通过正交实验优化了锆铝包膜钛白粉的工艺条件,研究了锆铝包膜量、包膜温度和钛白粉浆液浓度对钛白粉性能的影响,并研究了制备的钛白粉在水性乳胶漆及溶剂型聚氨酯涂料体系的应用性能。结果表明,包膜条件为锆包膜量2%,铝包膜量2%,包膜温度70℃,浆液浓度300 g/L时
近年来无为市委为推动村集体经济高质量发展,实施了党组织领办合作社试点工程并取得一定成效与经验,包括领办合作社的管理模式、入股机制,增加了村集体经济及农户收入,增强了村党组织功能,但也出现了一些共性问题,比如发展不平衡、项目特色差异性不明显、普通社员参与度不够高等,还需要持续完善相关配套政策及做法,持续推动村集体经济高质量发展。