基于时空特征学习的视频异常检测算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:David_Wang_GuanJun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能监控系统中的视频异常检测技术旨在自主检测出监控画面中的异常事件,有利于维护社会公共安全,具有较高的学术价值和工业价值,也是当前计算机视觉领域的研究热点之一。影响视频异常检测算法精度的主要因素包含事件的时空特征学习和异常评估两个部分,本文将从这两个方面着手研究,以实现事件的完备描述,增强异常事件的可分辨性,进而提高异常检测精度,主要内容包括:(1)针对基于深度学习的帧重构模型泛化能力过强而无法保证异常事件的较大误差问题,本文提出了基于级联时空特征学习的视频异常检测算法。该算法通过先后执行帧重构和光流预测学习事件的空间特征、时间特征及时空特征间的关联性,以级联放大的思想增强异常事件的光流辨识度。同时提出一种泛化能力评估策略,精准选取用于测试的异常评估模型,优化异常检测性能。(2)针对常规基于深度学习的异常检测模型无优化重点的问题,本文提出了基于增强时空特征学习的视频异常检测算法。该算法基于双编码单解码的结构充分发挥帧重构和帧预测方法的优势学习事件的时空特征。为进一步增强模型的学习能力,设计了一种包含反向擦除和支持向量数据描述的训练策略,引导模型按着更优的方向优化,提升帧的重构质量,并使所有正常帧的重构图像都尽可能相似,扩大异常与正常事件间的差异。(3)针对当前基于帧预测的异常检测模型更关注于正向时间信息,而忽略了从后往前的反向信息的学习偏差问题,本文提出了基于双向时空特征学习的视频异常检测算法。该算法设计了一个由前向预测和后向预测共同组成的双向预测模型,基于特征融合模块实现预测流间特征的动态融合,以此得到双向时空特征,利于提高模型的预测精度。同时提出一个基于金字塔的多尺度异常评估策略,保证复杂场景中尺度多样化的异常对象都能够被有效检测。在三个公共数据集UCSD Pedestrian、CUHK Avenue和Shanghai Tech上的实验结果展现了本文方法相对于当前先进方法的竞争性,大量的消融实验分析也验证了所提方法的准确性、有效性及稳定性。
其他文献
近年来,随着汽车数量的急剧增加,交通事故发生率也在逐年上升。同时,无线通信技术也在飞速发展,第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)提出基于长期演进的车到万物(Long Term Evolution-Vehicle to Everything,LTE-V2X)技术用于保证交通系统的安全运行。LTE-V2X运行在5.9GHz频段,支持上行链
学位
面部表情蕴含着丰富的情感和行为信息,可以直观地反映出人的情绪和心理活动。表情识别技术在安全驾驶、临床医学、智慧教学等领域有着广泛的应用,已成为计算机视觉研究中的热点。传统基于欧式空间的表情特征提取方法将图像作为标准的网格类型数据处理,虽然能有效地提取表情的时间和空间特征,但忽略了面部图像中的丰富的结构和关联特征,从而导致其特征表达能力有限,不利于于进一步提升对人脸表情的识别效果。论文结合与重庆某汽
学位
我国海上安全形势日趋复杂,海上军事争端越演越烈,能否快速准确地检测船舰目标极大地关系到战争的成败;因此,确保海域安全是我国现在以及今后军事战略的重点。近年来,随着合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术的发展,对船舰目标的精细化观测水平越来越高,使得利用深度学习相关技术挖掘船舰目标的深层特征和精细化信息,进一步提高SAR船舰目标检测性能已成为可能,引起了国内
学位
传统建筑业安全风险防控主要采用基于人工巡检的“人防”手段,存在不可回溯、可靠性差、人力成本高等问题。基于视频监控的“物防”手段在一定程度上可提升风险防控能力,但无法实现实时的风险要素识别和预警。随着人工智能技术的快速发展,基于智能化目标识别技术的智慧工地“技防”手段成为大势所趋。论文结合建筑工地环境复杂多变的实际情况,研究部署便捷、支持风险要素目标实时识别的轻量级目标检测算法和实现智慧工地风险监测
学位
情绪是一种能够表达人的思想、感觉等的综合状态,在人们的交流中有着举足轻重的作用。尤其在人-机交互的研究中,若能准确识别情绪,人-机交互的应用就会更加智能且自然。研究发现,情绪识别的研究综合了认知心理学、计算机视觉、人工智能和脑科学等领域,现已成为一项重要的交叉学科研究课题。如何准确和快速地识别出情绪,一直是该交叉学科领域研究的关键科学问题。目前较成熟的情绪识别算法中,ESRs算法能有效减少剩余泛化
学位
压缩感知理论不再约束于奈奎斯特-香农采样定理对采样频率的要求,其将采样过程和压缩过程进行有机结合,为如何进行有效的信号采样、传输和存储提供了新的模式,将压缩感知应用于图像处理领域,能够减少采样数据量且避免高速采样。从极少量的测量值中有效且高概率高质量恢复出原始信号是压缩感知图像重建研究的核心问题,学者们相继提出了传统和基于深度学习的压缩感知图像重建算法,传统算法基于数学推导是可解释的,但其重建质量
学位
行人重识别技术旨在通过对多摄像头拍下的行人目标进行身份一致性匹配,从而实现对跨摄像头下行人运动轨迹的准确追踪,目前被广泛应用于安全监控、道路交通、智慧校园等领域。面对大量的监控数据时,使用行人重识别技术进行智能识别,可以实现更快、更高效的信息处理和信息分享,提高生活智能化水平,对维护社会稳定安全都具有重要的意义。由于摄像机获取的行人数据集存在光照变化、复杂背景、姿势差异和遮挡等问题,目前的方法往往
学位
随着车辆正在向智能化、网联化演进,行车安全预警作为车辆重要的智能应用之一,受到学术界的广泛关注,有效的行车安全预警能够极大程度提高交通安全,提升驾驶体验。行车安全预警策略一般基于实时道路交通流特性以及本车行驶特性进行建立,如果能够及时发现行车过程中的潜在行车风险,并以之为依据,生成行之有效的行车策略,则能够防患于未然;因此,行车潜在风险的评价方法已经成为学术界的关注重点。本文从VTTI100car
学位
无人机(Unmanned Aerial Vehicle,UAV)作为一种新兴装备,具有灵活部署和易于控制等特点。将UAV应用于现代移动通信网络,从而扩大网络覆盖范围或构建UAV集群网络,已成为无线通信领域研究热点之一。与此同时,伴随着Alpha Go的成功,作为强化学习(Reinforcement Learning,RL)重要分支的多智能体强化学习(Multi-agent RL,MARL),由于能
学位
在高肥胖率和人口老龄化的趋势下,心血管疾病等慢性病发生率越来越高。对血氧饱和度和心率等关键生命指标进行持续可靠的监测,对于预防慢性病来说变得非常重要。基于光电容积脉搏波描记法(Photoplethysmography,PPG)的检测方法广泛用于无创、连续、实时的人体血氧饱和度、心率、血压等生命体征参数监测,为临床医疗检测和便携式医疗设备提供了重要的技术方案。本文研究和设计了一种用于脉搏波信号检测的
学位