基于深度学习的人体动作识别研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:laoyoutiaosc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频理解在人机交互、视频分类、自动驾驶等领域拥有广阔的应用场景,利用深度学习进行智能视频分析的方法逐渐受到重视。神经网络在图像方向上的成功为解决视频理解问题尤其是人体动作识别问题提供了思路。在现实场景下光照、背景、相机运动等条件多变,采用手动提取特征进行动作识别的鲁棒性不好,使用深度学习方法对于数据适应性更强。采用深度学习进行人体动作识别的方法中,双流卷积神经网络通过将RGB图和提取的光流堆分别输入到空间流卷积神经网络和时间流卷积神经网络中提取特征进行分类,存在用于特征提取的卷积神经网络深度较浅的问题,且使用深层网络模型在较小数据集上训练会出现过拟合现象。与此同时,从视频中采样单帧图像和单堆光流帧的方式缺乏长段时间建模,忽略了视频局部时间段特征的相关性和时序性,且在利用动作识别数据集训练过程中没有考虑多种样本不平衡的因素对训练结果的影响。本文的主要研究工作如下:(1)针对时空双流卷积神经网络模型特征提取模块网络层次较浅的问题,选择使用更深网络层次的神经网络以提取更有效的特征,引入残差网络模块,防止网络过深造成的退化现象,提出一种基于时空双流残差网络的人体动作识别方法(Spatio-temporal Two-stream Residual Network,STRN),方法中针对数据量较少,易过拟合的情况,先进行数据增强,然后采用将残差网络在ImageNet上预训练的模型迁移到人体动作识别任务,为时空双流残差网络初始化权值,使用更低的学习率进行学习,实验表明采用这种训练方式的深度残差网络提取特征能够在任务上取得更优的效果。STRN方法在UCF101数据集上取得了92.7%的识别准确率。(2)针对时空双流残差网络人体动作识别方法中采样时未针对时间进行建模的问题,提出一种基于时序特征融合的人体动作识别改进方法(Temporal Feature Fusion Spatio-temporal Two-stream Residual Network,TFF-STRN)。按照时序分段采样得到双流深度残差网络的输入RGB图和光流图,将每个时序分段采样输入到深度残差网络中得到时序分段特征,将外观特征按照时间顺序级联融合,再输入到多层感知机中学习得到空间分类特征,这种方式增加了空间流分段特征的时序信息,得到的特征更有效,时间流卷积神经网络平均深度残差网络输出的分段运动特征得到运动分类特征,同时引入一种带有调节因子的分类损失函数,降低易分样本对总损失的贡献,使模型关注于难分样本,解决训练过程未考虑数据集中样本数量、分类难易差异的问题,实验证明使用时序特征融合的TFF-STRN方法在动作识别数据集UCF101上的准确率达到94.1%。(3)设计并实现了一个运动短视频分类系统。通过该系统用户拍摄剪辑或选择符合要求的运动类短视频上传到后端,后端接收视频后使用人体动作识别算法对视频分类,自动为不同运动类型的视频打上相应类别的标签进行存储,将结果告知用户,同时该系统还提供按照分类查看所有用户上传的运动视频的功能,并能在首页展示用户关注类别最新上传的视频。通过本系统,用户能够无需手动分类快捷地上传视频,方便地搜索和浏览自己感兴趣类别的运动类短视频。
其他文献
随着经济社会的不断发展,人们生活水平的日益提高,对于水果的需求越来越大,尤其是苹果这一深受人们喜爱的水果品种,其需求量进一步扩大,这些都极大的促进了苹果种植业的发展.
摘要:基于工作过程和典型工作任务的课程设计,是工学结合中常用的设计模式,利用Photoshop进行图像处理与合成是平面设计专业的学生必须掌握的一项专业技能。本文基于典型工作任务分析的理论,探讨该理论在中职《Photoshop图像处理与合成》课程设计中的一般应用模式,以设计出更符合工学结合要求的课程。  关键词:Photoshop;图像处理;典型工作任务  中图分类号:G712文献标识码:A文章编号
1月25日,人社部在北京召开第44届世界技能大赛参赛项目论证会。会议提出了我国拟参赛项目名单,商议了第44届世界技能大赛全国选拔赛的相关事宜。这标志着我国启动第44届世界技能大赛参赛备战工作。  据人社部职业能力建设司负责人介绍,第44届世界技能大赛共设6个大类50个竞赛项目。此次参赛项目论证会逐一分析了50个项目,提出了我国拟参赛项目名单,将保留29个第43届世界技能大赛参赛项目,恢复两个第42
引起继发性血小板增多症的原因很多, 笔者对近1年来的所有引起该病的原因进行了分析, 其结果表明, 幼儿较其他年龄段人群更易患血小板增多症, 尤其是细菌性肺炎患者.
目前对网络微公益活动的管理在法律法规依据、监管责任主体、监管手段方式等方面存在不足之处,必须通过明确监管责任主体、完善监管法律依据、丰富监管手段方式,更好地发挥微
笔者对我院确诊为迟发性运动障碍(TD)的8例患者以硫必利合并异丙嗪治疗, 现将疗效报道如下.
客家饮食文化源远流长,客家菜肴文化底蕴深厚、风味独特,是粤菜的三大地方风味菜肴之一。但由于种种原因,客家菜肴在经营发展过程中缺乏扩张力和市场竞争力,一定程度上阻碍了客家
随着1999年高校开始扩招,高校的毕业生每年在递增,给社会就业带来很大负担。随着经济的发展,政府在解决社会就业压力的同时,为了有效地解决大学生就业问题,在社会上设立很多
1 病历介绍例1: 男, 27岁, 因车祸致当时昏迷入院. 查体: 浅昏迷, 躁动不安, 呼吸平稳, 血压15/9kPa, 右侧肢体肌力2级. CT示左额叶脑挫裂伤并颅内血肿. 入院后给予脱水、止
本文基于“能力核心”“能力分级”的职教课程开发理念,针对汽车运用技术专业课程体系构建及教学保障中存在的问题,在“职业能力教学与评价模块库”研制、课程体系构建、教学和