【摘 要】
:
随着现代信息技术的迅速发展,海量的短视频数据映入人们的眼帘。基于深度卷积神经网络的算法在图片识别领域取得了巨大成功,机器现在能够根据大量数据进行训练,理解短视频当中的内容。基于卷积神经网络的短视频分类系统依赖于图片识别,此类方法将输入的视频帧提取成为相应的描述向量,通过平均或者加权等池化方法将每一帧的预测进行融合来得到最终的视频特征表示,这类方法直接在帧级别表示特征进行融合,忽略了帧间低层特征的联
论文部分内容阅读
随着现代信息技术的迅速发展,海量的短视频数据映入人们的眼帘。基于深度卷积神经网络的算法在图片识别领域取得了巨大成功,机器现在能够根据大量数据进行训练,理解短视频当中的内容。基于卷积神经网络的短视频分类系统依赖于图片识别,此类方法将输入的视频帧提取成为相应的描述向量,通过平均或者加权等池化方法将每一帧的预测进行融合来得到最终的视频特征表示,这类方法直接在帧级别表示特征进行融合,忽略了帧间低层特征的联系。此外,在物体检测方面,目前的方法利用局部特征在不同尺度的特征图上面进行不同大小的物体检测,忽略了特征图之间的联系。本文为了解决这两个问题,提出了时序部分通道融合和非局部特征融合两种算法,并将其应用到短视频内容分类识别系统当中。本文的主要工作和贡献包括:1.提出了时序部分通道融合算法,提升视频分类准确度。目前的视频识别算法主要基于2D卷积和3D卷积网络。本文提出的时序部分通道融合算法能够将2D网络提取出来的中间层特征在时序维度进行部分融合,促进相邻时间的帧低层特征间的信息流动,以2D网络的速度达到3D网络的准确度,满足实际部署的需求。2.提出了一种非局部特征融合算法。该算法可以应用在基础网络当中,通过将基础网络提取出的尺寸不同的特征图进行特征融合,促进高层特征和低层特征间的信息交流,结合全局信息,提升检测的性能。3.基于以上算法改进,完成了改进后的算法在短视频内容分类和识别系统的设计和实现。将时序部分通道融合算法和非局部特征融合算法应用在短视频分类任务上面,并对系统的主要需求,模块功能等进行了详细描述。
其他文献
板溪期与南华冰期是我国华南新元古代的重要地质历史时期,这两段时期沉积的地层在华南地区分布也较为广泛,但自南华系提出以来,对其底界的位置选择一致存有争议。本文旨在前
硝基化合物是一类重要的精细化工原料,广泛地应用于染料、医药、农药、化纤、橡胶和炸药等行业。此外,由于硝基具有极强的官能团变换性能,硝基化合物被认为是“理想的有机合
目前,人们已经实现了采用多种方法制备ZnO纳米结构。然而,实现大规模可控制备高质量的ZnO纳米结构,仍然是一个挑战。本论文,首先利用简单的水热法来大规模可控制备ZnO纳米结
随着科技的发展,移动机器人被广泛应用于生产生活,例如焊接机器人、扫地机器人、仓储机器人等等,机器人的应用是社会发展的必然趋势,因为其可以提高劳动生产率、减轻劳动强度、增加人类生活幸福指数。单个机器人可执行的任务比较简单,但是在实际应用中有很多操作复杂、规模庞大的任务,此时,多机器人系统将更胜一筹,比如在搬运一个重物时,单个机器人可能难以保持平衡,而多个机器人可以通过协调合作共同完成。本文着重于研究
本文对班公湖-怒江缝合带中段塔仁本玄武岩进行了详细的研究,通过大比例尺填图、实测地层剖面和岩石地球化学等手段,并结合前人已有的研究资料,对塔仁本玄武岩形成的构造环境
在建设科技强国的道路上,科技型企业是科技创新的主体,也是实现自主创新的重要支柱。科技型企业的成长具有高投入、长周期、高风险等特征,针对科技型企业的成长特征研究其成
本文先介绍了一些位错理论和概念,又介绍了本文需要采用的分子动力学模拟方法,以及基础知识,然后建立模型,模拟出了在铜沉淀物和空洞串行干涉下刃型位错运动特性,并分析了铜
聚合物微孔发泡材料是指具有直径小于10 μm的泡孔且泡孔密度在109-1015 cells/cm3的一种新型发泡材料,其在大幅度降低聚合物用量同时不会显著降低力学性能,甚至会提高材料的
随着当代社会的快速发展,装配式建筑越来越发展成为建筑行业的一种建筑生产模式。装配式建筑有着绿色环保、现场湿作业少、施工速度快等特点。目前,国内外对装配式建筑的研究大多还是对框架结构之间的连接、剪力墙结构的连接和框架-剪力墙结构的连接,但是对装配式套筒灌浆连接的框架的研究甚少,故本文采用此连接方式分析研究框架的力学性能。本课题在国家科学自然基金项目(No.51678375)的大力支持下,基于现有梁柱
阿卡波糖(Acarbose)是一种α-糖苷酶抑制剂,用于治疗非胰岛素依赖型糖尿病,主要通过游动放线菌(Actinoplanes sp.)发酵获得。阿卡波糖通过对肠道内的蔗糖酶、麦芽糖酶和葡萄糖淀