基于卷积神经网络的视频异常检测算法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qutong19921107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国民经济快速增长、社会快速进步和国力不断增强需要有稳定的社会治安作为保障,能实时分析并在危害社会治安的异常事件发生时能及时上报的智能视频监控技术受到了广泛的关注。视频异常识别作为智能视频监控技术的一个重要研究方向,其研究重点是如何从提取视频的相关特征与处理并进行异常检测。传统的视频异常检测算法所使用的特征主要为基于人工设计的动作特征。但人工设计的特征需要一定的先验知识,这样的知识主要依赖于监视目标,并且很难在不同的应用中定义。基于卷积神经网络能够在训练过程中自动地学得与任务相关特征的特点,本文提出了基于卷积神经网络的视频异常检测算法。首先,本文针对现实世界中异常事件稀少、数据采集困难的问题,提出基于视频预测的异常检测算法,在训练阶段通过无监督学习视频预测来进行有效的特征提取与行为建模,在测试阶段则使用视频预测模型对视频进行预测,根据预测结果与真实结果之间的预测误差实现视频异常检测。在视频预测网络中提出以自编码结构实现视频的特征提取、时序建模以及预测帧的生成。采用3DCNN和LSTM结合的方法增强网络对视频动作的建模能力,并采取拼接的方法实现特征图融合以减轻特征提取过程中信息损失的问题。实验结果表明,本文改进的视频预测网络在视频动作预测上具有一定有效性,能够有效降低原网络预测结果的均方误差以及有效提高峰值信噪比。在异常检测任务上,本文改进方法也有效提高原模型的检测效果。之后设计了一种基于非深度学习模型提取的动作特征设计了一种多任务的视频预测模型,借助MOG2提取前景图以及Farneback提取光流图,使得网络能够同时预测出视频帧以及视频帧的动作特征。另外针对基于深度学习模型提取的动作特征,设计了另一种多任务的视频预测模型,借助Flownet2-SD提取光流图并用于衡量预测帧与真实帧在光流特征上的差异,通过最小化这种差异来优化视频预测网络。探讨了不同的辅助任务对不同数据集在视频预测能力以及视频异常检测能力上的影响。其中基于Flownet2-SD构造的多任务视频预测模型在UCSD Ped2数据集上得到了比当前最优的算法FFPAD更高的ROC曲线下面积以及更低的等错误率。
其他文献
本文从现代企业精细化财务管理背景、现代企业精细化财务管理的特点、现代企业精细化财务管理的作用、现代企业精细化财务管理的实施等等方面阐述了对现代企业精细化财务管理
①目的研究梗阻性黄疸大鼠内毒素血症与肠黏膜屏障功能检测指标二胺氧化酶及D-乳酸活性变化,探讨二胺氧化酶、D-乳酸、内毒素与肠黏膜屏障功能之间的关系。②方法建立雄性大
在分析我国铁矿石进口现状的基础上,着重讨论了铁矿石进口价格变动的影响因素,并针对各影响因素提出了降低我国铁矿石进口成本、提升钢铁企业国际竞争力的相关建议。
重大时政新闻报道与国家认同建构的关系国家认同是在有他国存在的情况下,国民对自己国家独特性的想象、认识和期待。就个体层面而言,国家认同是指国民个体在心理上认为自己归
由于人们生活消费程度的逐渐增长,外来游客的日益增多,伴随着中国西部旅游热的形成,对黄河石林景区来说犹如一把双刃剑,开发黄河石林,不仅消费收入有所提升,同时由景区旅游业
物流园区是区域经济发展的重要组成部分,目前我国物流园区总体数量增长迅猛,但在其发展过程中也逐渐暴露出一些问题。通过对江苏省31家具有代表性的物流园(物流基地或物流中心
在社会发展新形势下,随着我国城市化进程的持续深入,城市居民住房需求出现了大幅度的提升,这为我国行业发展创造了良好的社会条件。与此同时,广大企业面临的市场竞争也变得更
红高粱的叶儿撩呀撩眼儿,红火火的队伍闹呀闹势儿,白羊肚的手巾红呀红腰带,闹哄哄的唢呐催呀催人儿。安塞腰鼓敲呀敲得响,轰隆隆的鼓声震呀震天儿。
期刊
本文报道了西藏林芝云杉林的凋落量、凋落特征及凋落物中主要营养元素(N、P、K、Ca、Mg)的含量。3年的测定结果表明,林芝云杉林的年均凋落量为3843.23kghm-2a-1,其中枯叶量占70.52%,枯枝、杂物各占14.33%和15.14%。凋落物中主
七彩山鸡或雉鸡,俗名野鸡,是一种具有极高综合利用价值的"特养"珍禽。近10几年来,我国七彩山鸡养殖从分散饲养逐步向专业化、工厂化生产过渡,发展较为迅速。然而,驯养和集约化