基于深度学习的视频分类方法研究

来源 :北京工商大学 | 被引量 : 0次 | 上传用户：flordkk

【摘要】

：

【作者】

：

彭世禹

【机构】

：

北京工商大学

【出处】

：

北京工商大学

【发表日期】

：

2020年01期

【关键词】

：

视频分类时空关系特征提取三流深度学习网络框架特征聚合决策级信息融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文针对双流卷积神经网络在处理复杂视频分类时存在的相近种类易发生混淆和识别准确率较低的问题,提出了一种时空关系特征提取结合特征聚合及融合机制的三流深度学习网络框架。将关系流网络引入由空间流网络与时间流网络构成的双流网络中,重点解决双流法在视频特征提取中常常会出现的稳定性差、语义理解不足等问题;同时提出一种基于局部聚合描述符向量的特征聚合方法对时空关系特征进行聚合,可以减小类内差异,对时空关系网络所提特征进行合理地二次利用;本文还提出一种基于改进Softmax逻辑回归函数的决策级信息融合机制,可以更大尺度地保留不同子网络中关键帧间图像的时空关系信息,使网络可以更加真实地从空间、时间和帧间关系三个角度反映视频蕴含信息,大大降低了单个子网络对于不同动作判别的错误分类概率,保证了改进后的时空关系网络能够对视频内容具有良好的语义表达和种类识别能力;最后,除在HMDB51和UCF-101两个标准数据集上验证本文所提方法性能外,还根据实际校园监控场景制作了校园日常学生运动动作数据集,检验并证明了三流时空关系特征提取网络框架对于日常学生运动动作具有准确的分类效果,为保障校园学生安全提供了有力的科技支撑。

其他文献

What Burundi can Learn From Kenya in Absorbing Foreign Direct Investment

学位

团队过度胜任对个体创新绩效的影响机制研究 ——基于知识管理的视角

21世纪是以创新为特征的知识时代,在这个动态变化的环境中,随着技术的升级和变革的加快,创新已然成为企业盛衰的关键。为了顺应这一趋势,全国各地都在争相进行“人才大战”,人才红利越来越受到重视,然而在这一进程中,不可避免地出现了劳动力过度胜任的现象,而且在国际和国内劳动力就业市场普遍存在。随着时代的发展,团队合作的形式逐渐被大多数企业采用,如何充分发挥过度胜任者在团队中的积极作用,激励他们增加创新行为

学位

过度胜任团队氛围知识共享个体创新绩效

人口因素对居民消费的影响研究

学位

含有复杂噪声的非线性时序数据预测方法研究

复杂时间序列预测问题普遍存在于智能交通、天气预报、食品安全、金融经济等复杂系统中,不仅与日常生活息息相关,还与社会发展和经济发展紧密联系。如果能够准确地把握时间序列的波动方向,则可以帮助管理者制定更好的决策,提高效率并减小损失。然而,由于实际获取的时间序列具有高度波动性与复杂性,在一定程度上加大了预测难度,准确预测含有复杂噪声的非线性时间序列仍是一个挑战。本文从非线性时序数据预测方法研究着手,结合

学位

复杂时序预测深度学习网络时序分解协方差交叉融合

经济媒体生态环境风险议题的媒介建构 ——以《经济日报》为例

学位

从贾樟柯电影叙事之变看其电影价值取向的变化

学位

考虑不同区域的物流包裹检测方法研究

图像作为一种语义丰富的信息载体,在物流管理的实时监控中发挥着越来越重要的作用。一个异常物体通常与特定区域密切相关。对特定区域的异常目标进行检测,有利于提高检测分析的准确性,从而提高物流管理水平。在物流运输领域中,由于快递物品数量很多,快速分拣货物,导致掉件丢件的事情屡见不鲜。而在装卸搬运的过程中,包装底部柔软且凹凸不平等物品在传送带进行传送时产生物品掉落的现象和由于工人工作繁忙,物品遗忘在传送带下

学位

物流管理异常目标目标检测实例分割Mask R-CNN

保显著特征的三维数据修复算法研究

三维数据作为一种新兴的数字媒体,广泛应用于文物修复、医学诊断、数字娱乐、智能制造、智慧城市、3D打印等诸多领域。随着三维扫描设备和技术的发展,三维数据的获取更加的方便和普及。然而在三维数据获取过程中,遮挡、错匹配、抖动等情况不可避免,导致获取的数据缺失和不完整,使得重建出的三维模型存在孔洞,影响后续对模型的分析、编辑等操作,使模型在各领域应用中受限。因此,三维数据修复至关重要。三维数据修复的目标是

学位

三维数据修复显著特征孔洞

《经济日报》“精准扶贫”报道的框架研究 ——基于发展新闻学的理论视角

学位

基于FPGA的图像处理深度学习模型的压缩与加速

随着图像处理需求增多,深度学习的作用显著提高,图像处理深度学习模型在生活、生产、安防等领域的作用显著提升,如YOLO、SSD等目标检测与识别网络,为自动驾驶、行为识别等任务带来了极大的便利。但是,庞大的深度学习网络参数也给计算力提出了要求,大量的参数计算不仅影响了运算结果的实时性,也给要求低功耗的嵌入式端带来了巨大的能量消耗。在深度学习网络、FPGA技术及嵌入式技术的基础上,针对在嵌入式端实现图像

学位

FPGA图像处理深度学习模型通道剪枝Winograd最小滤波算法YOLO

基于深度学习的视频分类方法研究

其他学术论文