【摘 要】
:
近年来,随着计算机软硬件技术的发展,视频数据在互联网上呈指数式增长,基于视频的人体行为识别是对视频数据进行有效管理和分析的主要组成部分。本文利用深度学习相关理论,围绕准确识别视频中的人体行为的问题,从时间序列和空间特征两个维度展开研究。主要研究内容如下:(1)针对直接对全连接层输出的一维向量特征做时间序列建模而带来的识别效果不佳的问题,本文利用卷积长短期记忆神经网络(ConvLSTM)对卷积层输出
论文部分内容阅读
近年来,随着计算机软硬件技术的发展,视频数据在互联网上呈指数式增长,基于视频的人体行为识别是对视频数据进行有效管理和分析的主要组成部分。本文利用深度学习相关理论,围绕准确识别视频中的人体行为的问题,从时间序列和空间特征两个维度展开研究。主要研究内容如下:(1)针对直接对全连接层输出的一维向量特征做时间序列建模而带来的识别效果不佳的问题,本文利用卷积长短期记忆神经网络(ConvLSTM)对卷积层输出的特征图做兼顾空间信息的时间序列建模。为了更精准地捕捉行为动作,使用长短期记忆神经网络(LSTM)对ConvLSTM输出的特征做进一步视频描述。同时在特征提取网络中融入注意力机制以便提取到利于行为识别的特征,并探讨了融入的最佳时机。(2)为解决直接使用LSTM网络最后时刻的输出特征代表整个视频特征所导致的识别准确率不高的问题,本文设计聚合网络对LSTM所有时间点的输出做自适应聚合:首先对输入特征进行扫描得到权重系数;其次根据权重系数和已聚合得到的特征向量将输入特征融入聚合向量直到扫描完成得到最终的视频描述。改进后的人体行为识别模型的在数据集UCF101上识别准确率达到91.26%,比直接使用LSTM网络最后时刻的输出特征代表整个视频特征的建模方式提高5个百分点。(3)为充分利用空间信息和时间信息,本文使用权重融合的方式,将使用ConvLSTM和LSTM对卷积层输出的特征图建模的识别结果,与使用LSTM和自适应网络对全连接层输出的一维全局特征建模的识别结果进行融合,融合特征送入分类器得到最后的识别结果。空间信息和时间信息的融合使得识别效果进一步提升,识别准确率达到95.68%。
其他文献
Argonaute(Ago)蛋白在生物体中广泛表达。真核Ago蛋白是RNA干扰通路中的关键蛋白,调节基因表达;原核Ago蛋白是细菌抵抗侵入性遗传元件的防御系统,具有成为基因编辑工具的潜力。近年来生物信息学发展迅速,目前生物学研究逐渐由传统生物学湿实验过渡到实验与生物信息学结合的研究模式。数据库与预测器是该领域两个重要的研究内容。在现有数据库中,还没有专门的Ago蛋白数据库,且公共数据库中的Ago蛋
水系锌离子电池作为一种新型可充电二次电池,因其高安全性、低成本和绿色等优点受到广泛关注。然而,缺乏适合的阴极材料是阻碍锌离子电池市场化应用的主要原因之一。由于高的理论容量和丰富的嵌入位点,钒基材料受到越来越多的关注。但是二价锌离子在充放电过程中会与其主体材料发生强烈的静电作用以及钒基材料本身导电性较差,导致了Zn2+嵌入和脱出的反应动力学缓慢。基于以上问题,我们通过对V2O5进行碱金属离子预嵌和碳
碳化硅(SiC)纳米线因其耐高温高压、高机械强度、抗辐射等优异性能,广泛应用于极端恶劣环境下的电子器件。目前难熔材料熔化的温度高,关于SiC纳米线的熔化机理实验上知之甚少。力学性能是材料使用关键考虑因素之一,然而室温下的脆性和力学性能的分散性限制了SiC纳米线的进一步使用。材料的微观结构决定其宏观性能,本文从缺陷结构的角度出发,通过分子动力学模拟的方法研究了包含空位原子,间隙原子,孪晶界,堆积缺陷
针对小学生语文表达能力较弱的现象,教师要注重授之以渔,引导学生慢慢进步,并以语文园地中的"词句段练习"为例阐述相关对策:首先从多感官体验思考,让学表达更有序;其次从正反面抒发感受,让表达更丰富;第三用修辞精雕细琢,让表达更诗意;最后多元增添巧运用,让表达更独特。
电容器表面缺陷,对电容器的产品质量与后续生产环节的进行有着极大的影响,为保证电容器的生产质量,对其进行表面缺陷检测极为必要。对于电容表面缺陷的检测,人工检测的方法由于其效率低,消耗大量劳动力成本等缺点,使得许多电容器生产厂家不再采用。基于图像处理的传统视觉检测方法由于其特征提取算法的局限性,导致这种方法的检测效果与实际的检测需求有着一定差距。针对上述两种检测方法的不足,本文基于深度学习对电容表面缺
高铁的发展使得区域间的时间和空间距离被压缩,极大地促进了人员和资源的自由流动,提高了企业全要素生产率,降低了企业间的资源错配,同时还促进了企业管理者之间的面对面交流和企业的创新能力,对企业出口产品的生产产生了一定的影响。因此相对于以往文献中所研究的高铁开通使得企业内部资源发生调整,本论文采用的数据主要包含了2007至2013年间国内高铁、海关、工业企业和城市等,采用双向固定的效应模型,研究分析高铁
由金属谐振元件构成的频率选择表面(Frequency Selective Surface,FSS)通常周期性地排列在二维结构中,由于FSS具有优良的频率选择特性,经常用于雷达天线罩隐身。目前,带通FSS天线罩在实践中得到了广泛的应用,它可以正常传输天线工作频段的电磁波,并将带外电磁波信号从入射波的方向反射回去,以降低单基站雷达散射截面(Radar Cross Section,RCS),从而达到隐身
统编版教材“语文园地”中的“词句段运用”板块鲜明地指向了本单元语用点,精准地给学生提供用以锻炼运用语言文字能力的信息和资源,推动学生语言能力的生长。教师可以通过精准定位目标点、瞄准独特切入点、实践落实运用点来高效地使用好“词句段运用”板块提供的信息和资源,将“词句段运用”教学真正落到实处。
改革开放以来,中国凭借低廉的劳动成本快速融入全球价值链并成为“世界工厂”,但这种低附加值的生产模式无法打破被“低端锁定”的局面。与此同时,欧美等发达国家实施“再工业化”战略,印度等发展中国家的低成本优势开始显现,叠加国内生产成本的不断上升,中国制造业处于“新比较优势尚未确立、原有比较优势面临挑战”的中间阶段。由此可见,我国要提高制造业出口技术复杂度,提升制造业竞争力,打破发展僵局。在我国大力发展交
随着世界生态环境污染和化石能源逐渐枯竭,我国提出“碳中和”和“碳达峰”的目标,推进我国能源供给侧的改革,高渗透率的可再生能源发电比例不断升高,传统的火力发电机组装机比例逐步下降。配电网的结构也发生变化以适应可再生能源的并网。其中微电网是整合分布式电源的常见形式,微电网群是缓解可再生能源的间歇性、波动性和随机性以及促进未来能源互联网发展的趋势之一,但是微电网群组成单元和结构复杂,微电网与微电网、微电