论文部分内容阅读
随着多媒体和网络技术的迅速发展,多媒体信息与日俱增,然而如何有效地对这些视频数据进行组织、表达、存储和管理,以及如何对其进行快速检索与浏览已成为视频领域中急需解决的重大课题。由于视频数据自身内容的丰富性和多样性、结构的复杂性以及具有时空多维结构性,传统的数据管理与检索方案不能很好地从巨大的视频数据源中找到所需要的信息,于是基于内容的视频检索便应运而生。基于内容的视频检索是根据视频的内容及上下文关系,在视频分析的基础上,提取能够反映视频内容的各种特征,进而通过模式匹配从海量视频数据库中检索出相关的视频流。本文主要对视频检索的关键技术和方法进行了研究。1)通过对视频数据的分析,建立一种树型结构的视频数据分解模型。该模型描绘了从代表镜头、镜头聚类、镜头、关键帧、帧聚类到帧的结构化层次,从而构成了后续处理的基础。2)提出了一种改进的基于亮度直方图帧差的自适应镜头分割算法,该方法包括突变镜头的检测过程和渐变镜头的渐变过程,这两个处理过程由相邻两帧的亮度直方图帧差与自适应阈值的比较来自动进行选择,在突变镜头的检测过程中加入隔帧帧差法检测闪光灯,渐变镜头的检测采用基于帧间差方差的方法。实验结果表明:该算法具有较高的查全率和准确率,且计算复杂度低,易于实现。3)提出了一种代表镜头/关键帧提取算法。该算法可以控制代表镜头/关键帧的数量,而且计算简单,正确率高,有效避免了冗余。又针对如何进行镜头和帧聚类的问题,提出了一种聚类算法。该算法以提取出的代表内容为聚类中心,然后根据相似性估计,取与代表内容相似度最大的归为一类。实验结果表明该算法较好地表达了视频内容的分解。4)以树型结构的视频表示为基础,提出了基于关键帧的视频检索算法和基于镜头的视频检索算法。利用了视频分解的树型结构层次化的特点,提高了检索精度。实验结果表明:所提出的算法在确保较高的检索精度的前提下,也提高了检索速度。