【摘 要】
:
近年来,视频媒体设备产生了数以亿计的数据量,仅仅依靠传统分析方法效率不高,会消耗大量的人力物力,这给基于视频的人体行为识别算法带来了挑战。另一方面,早期算法对单一视频环境下的简单人体行为识别结果较好,但是在复杂的真实场景中,识别准确率不能满足要求。因此,本文主要研究复杂场景下的两类人体行为识别任务,分别为单目标人体行为识别和多目标人体行为识别,从多维度对特征进行提取,并提出了两种网络模型,主要内容
论文部分内容阅读
近年来,视频媒体设备产生了数以亿计的数据量,仅仅依靠传统分析方法效率不高,会消耗大量的人力物力,这给基于视频的人体行为识别算法带来了挑战。另一方面,早期算法对单一视频环境下的简单人体行为识别结果较好,但是在复杂的真实场景中,识别准确率不能满足要求。因此,本文主要研究复杂场景下的两类人体行为识别任务,分别为单目标人体行为识别和多目标人体行为识别,从多维度对特征进行提取,并提出了两种网络模型,主要内容如下:(1)提出了一种单阶段端到端的时频域网络(Time and Frequency Network,TFNet),将基于DCT(Discrete Cosine Transform)变换的频域学习方法应用在人体行为识别任务上。该网络同时考虑了时空和DCT系数特征,对应到两个主干分支,分别为时域分支和频域分支,并通过改进的基于注意力机制的特征融合算法将两个分支提取的特征进行深度融合。在JHMDB51-21、UCF101-24、AVA-80这三个数据集上做了充分实验,m AP(mean Average Precision)相对都得到了提高,分别达到了67.3%、78.29%以及31.3%的准确率。实验结果表明,TFNet对单目标和多目标人体行为的识别均取得了优异的结果,并验证了DCT系数特征对参数优化的有效性。(2)提出了一种自适应三维卷积网络(Adaptive Convolutional Neural Network of 3D,Ad CNN-3D)。本文通过构建一个具有自适应不同大小感受野的多分支三维卷积单元,进而构建出整个三维网络模型,并用该三维网络模型替换TFNet时域分支的主干网络。由于经过替换改进后的模型没有在大型人体行为识别数据集上预训练的权重,使用普通的参数初始化方式无法在JHMDB51-21、UCF101-24这些较小数据集上学习到泛化的行为特征,导致训练难以收敛,准确率不高。因此,本文使用了“Joint-Training”策略,即通过联合AVA-80数据集,将其作为训练辅助集,使得模型在JHMDB51-21和UCF101-24目标数据集上取得了更好的准确率,同时具备自适应感受野大小的能力。综上所述,本文围绕单目标与多目标人体行为识别任务,利用深度学习的方法,提出了基于频域特征的时频域网络TFNet,并在此基础上对TFNet的自适应性展开了研究,具有一定的研究意义和实用价值。
其他文献
小学数学的教学不仅仅要教会学生基本的知识内容,更要教会学生实用的思想方法。转化思想是小学数学中最常使用的思想方法之一,也是教师教学过程中不可或缺的一个实用的教育工具,因此,教师一定要加强转化思想在实践教学中的运用,帮助小学数学的教学过程更好地开展,尤其是对于图形几何方面的知识的教学,要加强转化教学的教育形式。当前对于转化思想在小学数学"图形与几何"中的应用还并不完善,因此,本文结合苏教版的数学教程
近日,美国食品和药物管理局(FDA)批准艾伯维(Abb Vie)旗下公司艾尔建(Allergan)眼科药物Vuity(pilocarpine,毛果芸香碱,1.25%滴眼液)治疗老花眼。Vuity作为一种外用药物,每天滴入双眼1次,滴入眼睛后,15 min就能起效,且疗效持久,患者无需戴眼镜就能阅读,是第一种专门用于治疗老花眼的滴眼液,但其只能缓解其症状而不能彻底根治老花眼。FDA批准Vuit
随着我国经济发展,房屋建筑作为与广大人民群众日常生活联系最为紧密的民生工程之一,其经营管理工作备受到了越来越多的重视与关注。在此背景下,房屋建筑工程施工企业都已形成一种共识,即明确经营管理是提升工程项目质量、企业形象、经营状况以及成本和利润的关键所在,但在具体的经营管理工作中,依然存在着许多亟待解决的问题。鉴于此,文章就房屋建筑工程的经营管理问题及对策展开详细探讨,旨在为类似项目提供参考。
能在减肥的同时增加肌肉吗?答案是肯定的。那么,现在就开始,让这一切成为现实。对于许多试图减肥的人来说,这个目标通常伴随着一种表现:肌肉增长。保持健康的肌肉重量对增进整体健康至关重要,尤其是减肥的时候。肌肉能增强力量、提升活动能力、改善心脏健康和提高胰岛素的敏感性。它与更长的寿命有关,并对提高基础代谢率发挥了重要作用。
在大多数国人心目中,水果酒大致等同于软饮料。其饮用价值、经济价值,完全无法与粮食酒相比。唯一的例外,是葡萄酒。是什么造成这种对水果酒的成见?葡萄酒又是如何突破成见一骑绝尘的?酒,酵母菌"驯化"人类的最重要副产品。为了追求酒精带来的兴奋感,最早实现饮食富余的人们,把多余的食物供奉给酵母,用以制造这种不提供热量,只刺激神经的化学物质。谷物淀粉、果糖、乳糖……所有的糖类,都可以是酵母菌的饲料。
最近,荷兰皇家帝斯曼集团宣布,旗下位于江苏省的4家工厂——帝斯曼工程材料(江苏)有限公司、帝斯曼江山制药(江苏)有限公司、帝斯曼(江苏)生物技术有限公司和百奥明饲料添加剂(中国)有限公司全部签署绿色电力交易协议,成为自江苏省绿电交易平台启动以来,首批采用绿色电力进行生产运营的工厂,
本试验旨在构建燕麦草常规营养成分含量的近红外预测模型。试验于2017—2019年,从我国京津冀等地区的牧场及种植基地收集了80份不同品种、不同产地和不同成熟度的燕麦草,参照燕麦草常规营养成分国标检测方法测定采集80份样品中水分(MSTR)、粗蛋白质(CP)、中性洗涤纤维(NDF)、酸性洗涤纤维(ADF)、粗脂肪(EE)和粗灰分(Ash)含量并进行燕麦草近红外光谱采集。使用OPUS7.5中的偏最小二
材料力学作为基础课,基于传统线下课堂教学模式存在的问题,本文提出材料力学线上、线下结合教学模式探索。通过雨课堂等线上教学平台弱化材料力学中抽象内容,同时结合单元课程作业,能有效帮助学生理解材料力学理论知识。在线下课堂教学过程中结合材料科学发展前沿,激发学生兴趣;同时通过线上学习理论基础上进行工程应用拓展。根据线上线下教学实际,结合OBE教育理念,改革考核方法,对学生课程学习进行跟踪性评价。结果表明