论文部分内容阅读
随着计算机技术的飞速发展,海量的多媒体信息涌现在网络上,对于如此庞大的数据量,基于内容的视觉信息检索技术应运而生。其中,基于内容的视频检索技术的产生,为人们提供了查询具有相似内容的视频数据的新手段。视频数据具备一个其他多媒体不具备的特征——运动特征,所以,应用运动特征进行视频检索服务,对于提高视频检索系统性能具有非常重要的意义。本文研究了基于运动特征的视频检索技术。根据数字视频的特点,视频中的运动可以分为全局运动和局部运动两种。全局运动也称为摄像机运动,是由摄像机的运动造成的镜头内所有像素点的整体移动;局部运动是指被拍摄物体在场景中的运动。因此,本文研究了两种算法:基于全局运动特征的视频检索算法和基于局部运动特征的视频检索算法。最后提出了一种基于矢量量化和全局运动特征的视频检索算法。主要研究工作如下:首先系统综述了基于内容的视频检索技术的发展现状,其中着重介绍了基于运动特征的视频检索技术。研究了一种基于全局运动特征的视频检索算法,并进行了仿真实验。首先通过对视频数据进行短时全局运动分析,较为精确的提取出了描述全局摄像机运动的双线形运动模型,并以该模型的8个参数作为运动特征,以特征点序列顺序匹配以及全局运动矢量距离平和为基础,构造了一个视频检索方案。仿真实验表明,在体育视频中,此检索方案能够实现一定程度的语义内容检索。研究了一种基于局部运动特征的视频检索算法,并进行了仿真实验。在利用全局运动模型参数对运动估计的基础上,提出了一种从一般视频序列中提取局部物体运动矢量的方法,并以局部运动矢量场的方向直方图作为检索特征,实现了一个基于局部运动信息的视频检索系统。仿真实验表明,基于局部运动信息的检索机制使该系统能够较好地检索到符合人们主观理解的运动视频内容。矢量量化(Vector quantization,VQ)是一种有效的有损编码技术,它的突出优点是码率-失真性能高。随着矢量量化技术的逐渐成熟,基于矢量量化器的多媒体信息检索算法越来越成为学者们研究的热点。由于矢量量化可以将大量矢量以最小失真的方式映射到有限个码字上,因此量化后的矢量可用于表示大量矢量的主要特征,保证了视频检索的效果;码字索引的直方图可以用于运动矢量的快速检索,保证了视频检索的实时性。本文提出了一种基于矢量量化和全局运动特征的视频检索算法。采用矢量量化算法剔除视频帧的运动矢量的异常点,并利用视频段中所有视频帧的运动特征矢量的索引直方图进行视频段的匹配。仿真实验表明,本算法具有的特点是:能够有效地表示视频的全局运动特征的统计特性,计算复杂度低,检索效率较高。