【摘 要】
:
本文针对双流卷积神经网络在处理复杂视频分类时存在的相近种类易发生混淆和识别准确率较低的问题,提出了一种时空关系特征提取结合特征聚合及融合机制的三流深度学习网络框架。将关系流网络引入由空间流网络与时间流网络构成的双流网络中,重点解决双流法在视频特征提取中常常会出现的稳定性差、语义理解不足等问题;同时提出一种基于局部聚合描述符向量的特征聚合方法对时空关系特征进行聚合,可以减小类内差异,对时空关系网络所
论文部分内容阅读
本文针对双流卷积神经网络在处理复杂视频分类时存在的相近种类易发生混淆和识别准确率较低的问题,提出了一种时空关系特征提取结合特征聚合及融合机制的三流深度学习网络框架。将关系流网络引入由空间流网络与时间流网络构成的双流网络中,重点解决双流法在视频特征提取中常常会出现的稳定性差、语义理解不足等问题;同时提出一种基于局部聚合描述符向量的特征聚合方法对时空关系特征进行聚合,可以减小类内差异,对时空关系网络所提特征进行合理地二次利用;本文还提出一种基于改进Softmax逻辑回归函数的决策级信息融合机制,可以更大尺度地保留不同子网络中关键帧间图像的时空关系信息,使网络可以更加真实地从空间、时间和帧间关系三个角度反映视频蕴含信息,大大降低了单个子网络对于不同动作判别的错误分类概率,保证了改进后的时空关系网络能够对视频内容具有良好的语义表达和种类识别能力;最后,除在HMDB51和UCF-101两个标准数据集上验证本文所提方法性能外,还根据实际校园监控场景制作了校园日常学生运动动作数据集,检验并证明了三流时空关系特征提取网络框架对于日常学生运动动作具有准确的分类效果,为保障校园学生安全提供了有力的科技支撑。
其他文献
21世纪是以创新为特征的知识时代,在这个动态变化的环境中,随着技术的升级和变革的加快,创新已然成为企业盛衰的关键。为了顺应这一趋势,全国各地都在争相进行“人才大战”,人才红利越来越受到重视,然而在这一进程中,不可避免地出现了劳动力过度胜任的现象,而且在国际和国内劳动力就业市场普遍存在。随着时代的发展,团队合作的形式逐渐被大多数企业采用,如何充分发挥过度胜任者在团队中的积极作用,激励他们增加创新行为
复杂时间序列预测问题普遍存在于智能交通、天气预报、食品安全、金融经济等复杂系统中,不仅与日常生活息息相关,还与社会发展和经济发展紧密联系。如果能够准确地把握时间序列的波动方向,则可以帮助管理者制定更好的决策,提高效率并减小损失。然而,由于实际获取的时间序列具有高度波动性与复杂性,在一定程度上加大了预测难度,准确预测含有复杂噪声的非线性时间序列仍是一个挑战。本文从非线性时序数据预测方法研究着手,结合
图像作为一种语义丰富的信息载体,在物流管理的实时监控中发挥着越来越重要的作用。一个异常物体通常与特定区域密切相关。对特定区域的异常目标进行检测,有利于提高检测分析的准确性,从而提高物流管理水平。在物流运输领域中,由于快递物品数量很多,快速分拣货物,导致掉件丢件的事情屡见不鲜。而在装卸搬运的过程中,包装底部柔软且凹凸不平等物品在传送带进行传送时产生物品掉落的现象和由于工人工作繁忙,物品遗忘在传送带下
三维数据作为一种新兴的数字媒体,广泛应用于文物修复、医学诊断、数字娱乐、智能制造、智慧城市、3D打印等诸多领域。随着三维扫描设备和技术的发展,三维数据的获取更加的方便和普及。然而在三维数据获取过程中,遮挡、错匹配、抖动等情况不可避免,导致获取的数据缺失和不完整,使得重建出的三维模型存在孔洞,影响后续对模型的分析、编辑等操作,使模型在各领域应用中受限。因此,三维数据修复至关重要。三维数据修复的目标是
随着图像处理需求增多,深度学习的作用显著提高,图像处理深度学习模型在生活、生产、安防等领域的作用显著提升,如YOLO、SSD等目标检测与识别网络,为自动驾驶、行为识别等任务带来了极大的便利。但是,庞大的深度学习网络参数也给计算力提出了要求,大量的参数计算不仅影响了运算结果的实时性,也给要求低功耗的嵌入式端带来了巨大的能量消耗。在深度学习网络、FPGA技术及嵌入式技术的基础上,针对在嵌入式端实现图像