【摘 要】
:
人体行为识别一直是智能视频分析领域的研究热点,近几年被广泛应用在虚拟现实、人机交互以及短视频拍摄等方面,具有重大研究意义。随着深度学习算法在计算机视觉中的快速发展,基于深度学习的行为识别算法层出不穷,研究者们从识别准确率、识别速度、模型结构等方面对行为识别算法进行创新,然而目前的行为识别算法在识别精度和网络模型复杂度上仍有改进的空间。得益于深度学习尤其是长短期记忆网络在行为识别领域中的高速发展,本
论文部分内容阅读
人体行为识别一直是智能视频分析领域的研究热点,近几年被广泛应用在虚拟现实、人机交互以及短视频拍摄等方面,具有重大研究意义。随着深度学习算法在计算机视觉中的快速发展,基于深度学习的行为识别算法层出不穷,研究者们从识别准确率、识别速度、模型结构等方面对行为识别算法进行创新,然而目前的行为识别算法在识别精度和网络模型复杂度上仍有改进的空间。得益于深度学习尤其是长短期记忆网络在行为识别领域中的高速发展,本文在长短期记忆网络的基础上,对已有的行为识别网络进行改进,以实现对行为识别算法的进一步研究。本文的主要工作如下:(1)针对传统长短期记忆网络只关注时序特征的问题,本文在传统长短期记忆单元的基础上,提出了一种输入微分的长短期记忆单元,将PID控制中的微分控制概念引入深度学习网络中。该方法不仅能够增加短期时间序列对动作识别的影响,而且考虑了人体做动作时不同速度和加速度对动作识别的影响,其中一阶微分对应动作速度,二阶微分对应动作加速度。本文将输入微分长短期记忆单元替换长期循环卷积网络中的基础长短期记忆单元,并在三个常用行为识别数据集上进行验证实验。(2)本文通过研究时、空微分对动作位姿信息处理的影响,考虑了动作速度和位置变化对于动作识别的影响,从控制的角度分析了时空长短期记忆网络,认为其可以添加强化微分特征的环节,从而增强动作速度变化和位置变化的特征。首先,本文在时空长短期记忆网络的基础上,提出了改进的时空微分长短期记忆单元,该单元结构能够同时兼顾时空信息和随时间变化的肢体位置变化信息。其次,本文进一步设计了适用于时空微分长短期记忆单元的堆叠方式,即在时空长短期记忆单元纵向传递的基础上增加了空间记忆状态的横向传递。本文将堆叠的时空微分长短期记忆单元在不同数据集上进行了准确率和稳定性测试,并与其他基于深度学习的行为识别算法进行了比较。
其他文献
十九大以来,我国地铁的运营里程和客运量均居世界第一,为了立足国情、着眼全局、面向未来,国家提出了交通强国建设战略目标,地铁建设进入了新的发展阶段。但是随着城市人口的激增,早晚高峰大客流的出现,屏蔽门夹人导致乘客受伤,夹物如女士包带、安全绳等引发安全事故的报道已经出现多次,作为地铁重要的安全防护措施,人们对屏蔽门控制系统防夹功能的安全性和可靠性的要求越来越高。本文从上述屏蔽门存在的问题出发,首先针对
随着无人机在航拍、农业等领域的广泛发展与应用,对无人机自主作业的需求也日益提升。研究无人机地面管控系统,实现无人机飞行状态的实时查看、航迹规划、故障诊断等功能,对促进无人机行业的发展具有重要意义。为此,本文设计了基于WPF的无人机地面管控系统,主要工作内容如下:首先根据无人机实际作业场景,分析管控系统功能需求和非功能需求,提出系统结构设计方案和功能设计方案,并完成通信链路的搭建和主界面设计。接着开
近几年来,我国高铁取得了巨大发展,高铁里程不断创新高;迅速发展的同时也面对着很多压力,其中保障高铁的安全运行显得尤为重要。大风是危及高铁安全运行的主要气象灾害之一,特别是近年极端大风天气发生频次增多,开展高铁沿线风速时空分布特征研究至关重要。一方面,通过对高铁沿线风速时空分布特征的分析可以实现对高铁沿线的大风易发区域、空间相关性等精准感知,对高铁沿线的气象(大风)监测点的设置及优化具有指导作用;另
阴茎鳞状细胞癌(以下简称“阴茎鳞癌”)是男性泌尿生殖系统最常见的恶性肿瘤之一,通常用“分化等级”来描述其恶性程度,根据患者病理征象划分为低、中、高3种级别。分级对后续治疗方案的选择和患者生存情况的评估至关重要,是病理医生在阅片时必须做出的诊断。它同时又是一个局部的指标,即一张切片中可能含有多种等级的区域,病理医生需要评阅所有的癌区域,分析其中细胞核的异形性、分裂象等特点,大致地做出分级诊断。这样的
增强现实技术通过将计算机生成的感知信息或虚拟对象叠加到真实世界中,以实现对真实世界的增强,提供一种与真实世界交互的体验。触觉反馈通过使用触觉设备与虚拟环境进行交互来感知触觉信息,与人类感知信息的方式相同。视触觉增强现实技术结合增强现实技术与触觉反馈,在增强现实环境下加入力触觉感知,使操作者通过触觉设备在真实场景中与虚拟对象进行触觉交互。将视触觉增强现实技术应用于手功能康复领域,让患者在视觉和触觉的
近年来,中国高铁的发展速度令人称赞,被誉为新时代中国的四大发明,其未来发展更加让人期待。相比于传统铁路,高铁速度快,对风速变化更加敏感。但是现有的预测方法分辨率小,预测精度不高难以满足高速铁路风速预测的需求。因此,如何及时准确地预测危及高铁行驶安全的大风,以便列车及时调整到安全车速,保障高铁安全高效运行意义重大。基于此,本文提出了一种组合模型预测方法并在此基础上设计了一套高铁风速预测预警系统,研究
点云分割是三维点云处理技术中的重要环节,分割结果的好坏对后续点云数据的应用有着直接影响,所以对点云数据高效准确地分割是三维点云处理领域十分重要的研究内容。基于此背景,本文对三维点云分割技术进行研究,结合超体素算法与三维点云自带的凹凸性,提出了基于超体素凹凸性的场景点云分割方法,具有运算速度快、模型复杂度低等优点。然而该方法仍存在常用算法容易混淆堆叠物体以及对较大物体过分割等缺陷。因此,本文结合超体
地球表面超过66%的区域常被云覆盖,而云的变化指示着各种天气现象的发生,当云的急剧变化发生在暴雨、雷电等灾害性天气中时,将会对人类的生活产生极大影响,甚至威胁人类的生命安全。尤其是西藏地区,夏季的强对流天气极易导致自然灾害的发生,因此需要监测该地区的云团变化情况以预防灾害的发生。风云四号A星实现了对云的实时观测,可提供高时间分辨率且多通道的观测数据,借助该数据分析云的动态变化可实现更为准确的天气预
目标检测作为计算机视觉的重要研究领域,目前在无人驾驶,工业制造,智能医疗,安防等领域得到了广泛的应用。然而在目标检测中,因目标检测场景复杂,待检测目标尺寸存在较大差异,预测分支使用特征与检测任务所需特征不匹配等问题,导致检测网络精度较低的问题。本文针对目标检测网络中存在的上述问题,提出了基于多尺度特征融合和注意力机制的目标检测方法。本文主要工作如下:(1)目标检测任务中,针对待检测目标间存在较大尺
“创客”教育是国外首先提出的一种新型的教育模式,是未来教育改革与人才培养的趋势,在国外,Scratch编程作为信息技术课程被广大学生所喜爱。目前市场上大多是基于Scratch二次开发的可视化、积木式工具,而且大部分只能实现基础的动画、故事、数学等逻辑编程,无法支持后续的电子机械类课程的教学活动。例如北斗作为国家重要的战略新兴产业,很多创客教具不支持北斗芯片的运行,无法让北斗工程以简洁的积木块形式走