论文部分内容阅读
随着技术的发展以及公共安全面临的严峻挑战,中国近年来大规模开展“平安城市”工程建设,视频监控已经在社会中得到非常广泛地应用,并成为主要的安全监控手段和方法。而在智能监控领域中,对海量监控视频进行有效地分析处理成为亟待研究的热点问题。在智能视频监控处理中存在的一些主要问题包括:(1)视频监控中从复杂场景中提取运动对象;(2)视频监控中对于特定事件进行智能分析;(3)视频监控中海量对象的快速检索。针对这些问题,本文进行了相关研究,主要研究工作和创新点如下:1)提出了一种基于局部频域特征的鲁棒运动对象提取方法视频监控中人们最感兴趣的往往是那些运动的对象,然而场景中的噪声以及动态背景等会对提取结果产生很大的影响。为此,本文提出了一种基于局部频域特征的鲁棒运动对象提取方法。该方法首先从视频帧图像中提取像素级的局部频域特征,并通过非参数建模方法构建实时更新的背景模型,最后实验表明,本文的方法与现有的一些算法相比能够在动态背景以及光照变化的场景中取得更好的效果并且平均F值提升了5.46%。2)提出了一种基于归一化运动能量图的运动对象摔倒事件检测方法针对视频监控中需要针对特定事件监测的场景,本文提出了一种基于视频分析的运动对象摔倒事件检测方法。该方法首先使用上述运动对象提取方法从视频中提取出人体轮廓,通过使用椭圆拟合轮廓并产生归一化运动能量图,然后根据从中提取的运动特征使用多类别SVM对摔倒过程的不同阶段进行分类,最后基于一个语法校验模型进一步检测得到摔倒事件。实验结果表明,相较于现有的一些方法本文方法对于摔倒检测的灵敏度达到了95.2%。3)提出了一种支持多种特征融合的海量对象哈希检索方法针对传统哈希检索由于仅仅支持单种特征而存在特征描述不够充分的问题,本文研究并提出了一种支持多特征融合的海量对象哈希检索方法。该方法将多种特征利用核技巧映射到一个非线性组合的核空间中,然后在标注好的训练数据集上学习得到各个对象对应的哈希码,最后学习一个基于非线性组合核空间中超平面投影的哈希函数。基于Youtube Faces数据集和从互联网爬取的人脸图像集的实验表明,本文方法相较于现有的一些方法检索准确率最高可以提升7.6%,并且使用多特征融合的哈希结果优于仅仅使用单个特征时的结果。4)提出了一种基于深度学习的海量对象哈希检索方法针对在哈希学习中所提取的低层特征与高层语义之间存在很大的差异一—即“语义鸿沟”问题,本文提出了一种基于深度学习的语义相似哈希检索方案。该方案包括两种方法:基于层叠RBM的语义相似哈希学习方法(Deep Hash,即DH)和基于CNN的语义感知哈希学习方法(Deep Perceptual Hash,即DPH)。(1)DH方法:从传统哈希学习的目标出发提出新的目标函数以及正则化项,并引入了层叠RBM构建深层哈希学习模型;(2)DPH方法:基于DH方法的思想,使用CNN直接从图像学习得到哈希码,同时引入了正交约束下的学习方法,保证所得哈希码的紧凑性。在CIFARIO数据集上的实验表明,本文提出的基于深度学习的哈希方法性能要优于其他的一些“浅层”哈希方法,其中在生成48比特哈希码的情况下DH方法和DPH方法的平均准确率分别提高了5.72%和8.17%。本文研究是国家自然科学基金“结合多粒度语义的海量视频P2P快速相似性检索”(编号:60975045)、国家科技支撑计划课题“增强型搜索系统架构、关键技术及测试规范的研究”(编号:2011BAH11B01),和中国科学院先导专项子课题“网络视频传播与控制”(编号:XDA06030900)的一部分。