【摘 要】
:
智能监控系统在社会与国家安全中具有重要地位。基于监控视频的群体异常检测是智能视频监控领域一个代表性问题,同时也是计算机视觉与机器学习交叉领域的研究热点之一。其中,基于深度学习的群体异常检测方法由于其泛化性能好、计算速度快、适应性强等优势成为该方向研究的主要方法之一。本文依托于群体异常检测的研究背景,以深度学习的方法作为切入点,采用基于误差图特征的检测方法,针对视频群体异常检测问题开展了研究工作,具
论文部分内容阅读
智能监控系统在社会与国家安全中具有重要地位。基于监控视频的群体异常检测是智能视频监控领域一个代表性问题,同时也是计算机视觉与机器学习交叉领域的研究热点之一。其中,基于深度学习的群体异常检测方法由于其泛化性能好、计算速度快、适应性强等优势成为该方向研究的主要方法之一。本文依托于群体异常检测的研究背景,以深度学习的方法作为切入点,采用基于误差图特征的检测方法,针对视频群体异常检测问题开展了研究工作,具体包括关于误差图的生成、误差图的特征提取以及异常检测模型的构建三个部分。1)针对误差图的生成问题,本文提出了两种帧生成网络:一种为基于变分自编码器的帧重构网络,该网络通过对输入视频图像序列当前帧重构实现误差图生成;另一种为基于U-net的帧预测网络,该网络基于输入视频图像序列对下一帧图像进行预测,从而实现误差图的生成。本文对以上两种方法进行了设计、实现与结果对比,并最终通过计算生成帧与真实帧之间的差异实现了最优误差图的生成。2)针对生成误差图的特征提取问题,本文提出了一种基于预训练VGG网络的特征提取方法,主要基于VGG网络的卷积池化结构对误差图的特征进行提取。本文还采用传统的群体异常检测研究思路加以对比,即直接对视频进行时空特征的提取,进而完成异常检测模型的构建。针对传统思路中的特征提取,本文采用P3D网络对原始视频图像序列进行特征提取作为对比算法,该网络利用时间卷积与空间卷积操作实现对视频时空特征的提取。3)针对异常性估计问题,本文提出了基于多单类支持向量机与基于多混合高斯模型的方法。基于多单类支持向量机的方法主要利用异常事件在特征空间中与正常事件的特征度量距离较远的特点来进行异常性估计;基于多高斯混合模型的方法主要通过构建正常事件在特征空间中的分布概率密度模型计算异常事件的概率并将其作为异常性估计度量实现异常检测。本文在UCSD数据集上对上述三方面工作进行了实验验证。结果表明基于误差图特征进行群体异常检测的方法得到了较好的检测效果与较为优异的数据指标。该研究为视频异常检测提供了一种全新的研究思路,有较高的理论研究意义与应用推广价值。
其他文献
高炉炼铁是钢铁行业的上游主体工序,也是钢铁行业的重要组成部分。高炉炉况诊断对于高炉的稳定运行具有非常重要的意义。由于高炉炼铁是多变量、非线性、多相多场耦合、时变的复杂工业过程,高炉炉况的诊断与预报一直是工业中未能很好解决的难题。随着现代工业检测手段的不断进步,高炉炼铁过程数据的采集变得更加实时可靠,基于数据驱动的主元分析、支持向量机等高炉炉况诊断方法已成为高炉炉况诊断领域研究的重点。本文针对高炉生
随着各行各业的发展,人们关于优化算法的研究成果日渐丰富。在这一过程中,诞生了许多思路独特、基于全新寻优机制的优化算法,基于李雅普诺夫理论的优化算法(Lyapunov-based optimization algorithm,简称为 Ly-based 优化算法)就是其中之一。Ly-based优化算法将李亚普诺夫理论引入优化算法当中,将优化问题描述为动态系统进而对动态系统的平衡点进行求解,有效地解决了
文章分析了苏州市结对合作帮扶阜阳市取得的成效,总结了苏州市结对合作帮扶阜阳市存在的问题,从政府合作角度探索欠发达地区依托国家中心城市加快发展的新路子,以期为阜阳市乃至皖北地区政府跨区域合作提供经验和示范。
随着社会的日益发展,人们面临的大气环境污染问题日益严峻,而挥发性有机物是造成大气污染的主要原因,当空气中VOC气体超过一定浓度后,将会损坏人体的健康,因此开发出快速、稳定的VOC气体传感器具有重要意义。在众多气体敏感材料中,基于金属氧化物半导体的气敏传感器具有制作简单、高灵敏度、响应和恢复速度快和成本较低等优点引起了广大科研工作者的极大关注,成为了近年来气体检测方向的一个研究热点。已知,基于金属氧
受空气中悬浮颗粒的散射作用,雾霾天气下获取的图像会出现整体清晰度不足、信息丢失等问题,限制了图像在生产和生活中的各个领域中发挥其应有的作用。图像去雾技术可以显著改善雾霾图像的视觉效果,有着重要的研究意义。此外,随着深度学习技术的不断发展,构建强大的数据集以满足训练图像去雾网络的需求也显得尤为重要。综合以上背景,本文从以下三个方面开展了研究工作:(1)研究了基于雾气浓度量化模型的图像去雾算法。本文根
在传统生产调度研究中,假设机器一直可用,而实际中机器由于使用而逐渐磨损,使得生产效率降低,甚至发生故障。预维护虽然能够降低故障发生率,提高机器的性能,延长其使用寿命,但也会占用资源,因而维护与生产分开考虑将引发调度冲突。生产与维护集成调度问题以其协调性受到越来越多学者的重视,尤其是随着状态监测技术的发展,基于状态的预维护与生产集成调度问题逐渐成为研究的热点问题之一。本文分别以最大完工时间和总完工时
随着大规模摄像机网络在各大城市中的部署,公安部门能够获取海量的图像与视频数据。然而,通过人工的方式进行图像与视频分析需要付出大量的时间以及人力。行人搜索算法从场景图片或视频帧中对特定行人进行搜索,能够大幅降低人工查找带来的时间成本与人力成本。但是,当前端到端的行人搜索算法没有针对行人图像的外形特点做调整。同时,检测与重识别的任务的差异性也会使端到端的行人搜索模型的检测性能与重识别性能的下降。本文根
近年来,时间银行作为一种新兴的志愿服务时间储蓄机构,在科学研究与社会实践中受到广泛关注。时间银行是由卡恩提出的一种有偿志愿服务模式,其内涵是将志愿者的公益服务时间记录下来存储到时间银行,待到需要时再取出来使用。由于我国社会逐步进入老龄化,时间银行模式主要应用于社区互助养老领域,该模式不仅可以提高公民的社交能力,而且能有效地缓解社会与国家的养老压力。但是,随着志愿者与需求者数量的不断增加,时间银行传
在AR/VR、无人驾驶和移动服务机器人等领域,SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)技术有着广泛的应用。基于单目视觉的SLAM技术无法获得环境的绝对尺度且对环境的要求较高,而IMU(惯性测量单元)能够提供绝对的尺度信息,对于动态场景、快速运动等复杂的情况具有很高的适应性,与单目视觉在性能上具有很强的互补性。为了保障系统的准确性、实
近些年来,随着科学技术的发展以及城市中监控系统的大规模普及,社会和个人的安全问题得到了日益重视。监控视频作为公众安全领域最重要的手段之一,在智能安防、人机交互以及商场导购等领域扮演着重要角色。然而,面对海量的监控视频数据,仅仅依靠人工监督的方式不仅消耗大量的人力资源,也极有可能遗漏掉关键信息,延误破案时机,给人民群众的生命财产造成巨大损失。因此使用计算机来高效、准确的搜索行人的重识别技术应运而生。