论文部分内容阅读
随着多媒体技术的迅速发展,多媒体数据正以指数级增加。因此,如何从海量的视频中快速高效的检索出所需要的视频变得十分重要。基于内容的视频检索通过对视频结构分析,将视频分割成关键帧、镜头、场景,最终,以镜头为单位,根据用户提交的视频实例,在视频数据库中查找与其相似的视频片断,并根据相似度的高低给出检索结果。在一定程度上满足了以上需求。本文首先综述课题的研究背景,并分析目前国内外已提出的主流基于内容的视频检索方法。在综合分析了以往的基于内容的视频检索方法的基础上,本文提出了基于模糊进化免疫网络的关键帧提取算法、镜头时空特征提取方法和基于概率距离的镜头相似性度量方法,具体内容如下:(1)提出一种基于模糊进化免疫网络的关键帧提取算法。通过将模糊进化免疫网络理论引入,提出了一种基于模糊进化免疫网络的关键帧提取算法。该算法把一个镜头中的每一帧视为抗原Ag,把模糊进化免疫网络中的节点(需要提取出来的关键帧)视为抗体Ab,通过对模糊进化免疫网络不断优化更新,最终提取出最能代表整个镜头的关键帧或者关键帧的组合。(2)研究镜头时、空特征提取方法。时间特征方面,定义了一个带有时间信息的镜头加权颜色直方图来表示,每个镜头对应一个镜头加权颜色直方图;空间特征方面,通过计算灰度共生矩阵具有代表意义的五个参数熵、对比度、能量、相关性和逆差距来表示一帧图像的纹理特征;通过将帧图像颜色块图化,对每个块图分别计算面积比、质心、x方向和y方向的标准差、x方向和y方向的区域长宽比来构造表示图像空间结构特征的空间结构信息统计直方图。(3)提出一种基于概率距离的镜头相似性度量方法。空间信息相似性方面,引入概率距离理论,先将提取出来的同一个镜头的底层空间特征向量看成一个组合,然后通过一种非线性映射将空间特征向量组合映射到高维空间进行高斯分布建模,最后通过计算高维空间两空间特征向量高斯分布间的概率距离来度量两镜头空间相似性;对于时间信息相似性,由于每一镜头对应一个镜头加权颜色直方图,本文利用直方图交的方法求解;最终,两镜头的总相似性可以通过对镜头空间信息相似性和时间信息相似性加权求和来求解。(4)研究开发镜头检索原型系统框架。采用模块化的设计思想,设计实现镜头检索原型系统,并通过实验对比验证上述方法的有效性。