基于深度学习的动作识别研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:tianwaiyun6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能与物联网的发展,人体动作识别在智能视频监控、智能人机交互、虚拟现实和运动分析等领域的需求日益增加。然而由于动作识别涉及多个学科且实际应用场景多变,一直是个充满挑战的研究方向。基于深度学习在图片分类任务取得的巨大成功,研究学者将其逐步应用到人体动作识别领域,但仍存在着动态特征不够高效、无法充分利用多模态信息等问题而无法实现实用化。为了充分挖掘动态特征以及利用多模态信息互补关系,本文着重研究高效的特征表达和特征融合来提升动作识别准确率。本文的主要贡献有三点:(1)基于光流有效性本质研究了一种人体轮廓特征来表征视频中的动态信息,即人和物体轮廓特征(Human–Object Contour,HOC),通过结合物体类别包含了更高阶的语义信息,从而可以充分挖掘视频中的动态逻辑信息,优化光流动态特征。(2)研究了一种高效的多模态信息融合网络,即多模态有注意力的融合网络(Attentional Multi-modal Fusion Network,AMFN)。借鉴集成学习中的层叠泛化思想,同时参考人类视觉的选择性注意力机制,结合每个视频本身特征决定不同模态应分配的注意力大小,实现了多模态信息的最大化利用。(3)嵌入式端实用化尝试。将HOC特征应用在Jetson TX2嵌入式开发板提升动作识别应用准确率,同时利用TensorRT神经网络加速引擎实现推理过程的加速,有效提升了动作识别应用的实时性。实验结果表明:(1)HOC动态特征与RGB静态特征有效互补,在超过60%的动作分类上都有提升;(2)结合HOC特征和AMFN网络,在动作识别数据集UCF101(96.0%)和HMDB51(72.2%)上取得了较佳表现;(3)在Jetson TX2嵌入式平台结合HOC特征,初步实现了动作识别应用系统,并基于TensorRT加速引擎将模型前向计算的速率由原先的27FPS提升至153FPS。综上,实验结果达到了指标要求。
其他文献
介绍大源渡枢纽水电站厂房活动屋盖的设计、制造、安装、调试及使用情况。
董湘玉教授为国家级名老中医,精通中医经典著作,尤其是《伤寒论》与《金匮要略》,在诊治脾胃疾病及身心疾病治疗方面造诣颇深,从医40余载救治患者无数,本文主要介绍董湘玉教
目的:此研究收集了烟雾病患者的相关临床资料,目的为探究烟雾病与贫血及相关指标的关联性,同时分析缺血型烟雾病和出血型烟雾病各自的疾病特点,试图寻找影响烟雾病发病和其导
本文以中间体油酸三乙醇胺双酯、一氯乙酸为原料,在一定条件下合成了新型衣物洗涤用两性柔软剂——油酸三乙醇胺双酯甜菜碱,探讨了合成的优化工艺条件,并对产物进行乳化以及
即食贻贝加工技术阎亚梅,卢长润贻贝是软体动物贝类的一种,有紫黑色外壳,俗名淡菜、海红,除自然生长外,因生命力强,容易大量人工养殖。贻贝不仅有较高的营养价值,而且含有多种活性物
近些年来,建筑问题不断出现,建筑质量更是与人们生活密切相关,只有优质工程才可从根本上对人们总体生活质量加以提升,对人们当前居住环境加以改善。本文以阐述建筑施工期间防
当前高职教育模式不断转型,层次逐步丰富,由传统的学院式教育模式向成人就业导向模式转变。在高职教育模式转变的同时,高职专业教师也要转变思想,顺应时代要求。本文通过教师
随着越来越多建筑工程的兴建,社会各界对建筑工程施工质量的关注度逐渐加强,保障施工质量既是适应社会发展的必然要求,同时也是保障社会稳定及消费者权益的有效举措。在房屋
市场导向企业管理模式是一个新的管理概念,也是新的企业管理理念和方式。本文从市场及企业管理实践发展的角度,提出市场导向企业管理模式的概念,并对该管理模式的内涵做初步
论中国东南地区的岩画李洪甫新文化运动的开始,继之以现代考古学的兴起,许多于“国学”造诣甚深的专门家致力于古物遗存与文献辨证相结合的探索,对被誉为民族摇篮的中原大地投之