时空联合描述的视频行为识别算法研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wsw361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别可有效辅助肢体语言的理解,相关研究已成为计算机视觉领域的热点研究课题,具有重要的研究意义与广泛的应用价值。目前主流的行为识别算法,主要围绕从视频数据中高效提取和利用时空信息进行研究,从而提高模型的识别性能。本文以视频行为识别为研究对象,基于空间和时间维度中丰富的上下文关系及全局关系约束,分别提出和实现了三种人体行为识别算法。本文的主要工作包括:(1)提出了一种运动增强的时空表征聚合网络(Motion-Enhancement SpatialTemporal Aggregation Net,ME-STANet)。ME-STANet通过引入可微分TV-L1卷积层,捕获特征图通道的光流,以此获得丰富的上下文表征,然后借助运动注意力引导模块,增强外观特征图中的重要元素。UCF 101数据集上的实验结果表明,所提网络可使准确率提高3.25%,有效提升行为识别算法的性能。(2)提出了一种时空协同描述的行为识别网络(Spatial-temporal Collaborative Action Recognition Network,StARNet)。StARNet基于双流网络机制,可协同考虑时空关系表示和决策融合。所提网络首先利用前文所提ME-STANet模型获得增强的时空关系表征,同时在光流支路也引入ME-STANet模块,进一步增强时序关系的表征能力。在UCF101数据集上,所提StARNet模型的准确识别率与前述MESTANet网络相比提高了5.32%,实验结果表明光流支路的引入可进一步提高行为识别的准确率。(3)提出了一种基于图表征的全局时空关系推理网络(Graph-based Global Spatial-temporal Relation Reasoning Networks,GStRNet)。GStRNet通过全局推理Glo Re单元,将感兴趣区域的特征投影到一个交互空间,采用图卷积得到其全局关系,然后再映射回原空间,以此捕获深度网络的长距依赖关系。同时GStRNet可对全局时空信息进行多步推理,得到更深层的全局关系表示。UCF101数据集上的实验结果表明,所提GStRNet模型可取得95.8%的准确识别率,优于前述MESTANet与StARNet模型,并优于目前其他典型行为识别算法。
其他文献
广义分布参数系统由于大量地应用在航天工程、生物工程、材料化学等工程领域,其控制问题的研究具有广泛的实际背景。迭代学习控制是具有记忆和修正机制的智能控制算法,采取“
钒酸盐体系微波介质陶瓷因具有低烧结温度而备受人们关注。BaZnV2O7、BaMg2V2O8和BiMg2VO6都属于钒酸盐微波介质陶瓷材料,具有适宜介电常数、表现出优异的微波介电性能而受到
磨机是选矿工艺中的关键设备,其工作环境恶劣,结构和受载情况较为复杂。传动系统作为动力传输结构容易产生疲劳损伤而导致磨机无法正常工作从而造成巨大的经济损失。其中,传
聚丁二酸丁二醇酯(PBS)是一种性能优异的可降解聚合物材料,在生产生活中得到了广泛的应用。但由于PBS容易燃烧,具有较高的火灾安全风险,故有必要对其进行阻燃处理,拓展其应用
数字剪切散斑干涉术可以实现对被测物体的位移、形变、震动等诸多信息进行有效的测量,由于其具备高精度、非接触性、可以实现全场测量等优点,在工程技术领域得到广泛的利用和研究。但目前的数字剪切散斑干涉术在系统搭建成型时剪切量就已经确定,无法在元件固定的情况下根据测量情况灵活地对剪切量进行调整,限制了数字剪切散斑干涉系统的使用场景,不利于系统集成化。为了克服这一瓶颈,本文提出了基于空间光调制器的数字剪切散斑
汽车产业是国民经济的支柱产业,是现代社会必不可少的组成部分。随着汽车数量增加与能源的日益紧缺,由传统汽车引起的能源短缺问题与大气污染问题亟待解决,新能源汽车成为国
氧化镁作为一种无机功能材料,在众多领域均有十分广泛的应用,其中球形形貌的氧化镁在导热、抗菌、吸附、催化和液相色谱等领域有着很好的应用前景。球形氧化镁无法直接制备,
目的:探讨间充质干细胞治疗肝硬化的有效性和安全性,并对间充质干细胞治疗肝硬化的移植时机、移植剂量、移植次数以及移植途径进行学习。方法:回顾性分析福建医科大学附属协
损伤诊断是结构健康监测的重要组成部分之一,基于输入和(或)输出信息,识别系统物理参数(如刚度、阻尼和振型等)的数值变化,可对结构健康状态进行评估。但由于实际限制,测量信息包括结构响应和外部输入等往往无法全部有效观测。此外,结构损伤时表现出来的非线性行为具有复杂性、多样性等特征,大多难以通过某一具体的参数化模型描述或预测其非线性恢复力(Nonlinear Restoring Force,NRF),而
精准施肥通过获取土壤养分含量,针对不同土壤不同作物进行平衡施肥。但是,大量的土壤养分采集和化验会增加农作物的种植成本,因此,合理划分采样网格,减少采样数量是十分必要的。科技的进步带动着各行各业的技术发展,而数据挖掘技术在各个行业领域的应用也日益风靡,主要的应用领域有各个传统行业、金融业、IT业等。数据挖掘与精准施肥技术相结合目前是本论文研究的重点内容。在农田作业施肥这一重要工作时,若可以根据作物以