论文部分内容阅读
随着网络及多媒体技术的迅速发展,数字视频的应用越来越广泛,海量的视频信息不断涌现,如何从这些内容丰富的视频中找出自己感兴趣的视频段进行播放和浏览,是人们普遍关注的一个问题。因此,为了有效地对视频进行分析和检索,在信息学科形成了一个全新的领域--基于内容的视频检索(Content-BasedVideoRetrieval,CBVR)技术。
对视频进行基于内容的检索和浏览,首先要对视频进行结构化。结构化的视频包含帧、镜头、场景和逻辑故事单元等部分。因此,基于内容的视频检索包括镜头的分割、关键帧的提取和场景转换检测等。其中镜头边界检测是基于内容的视频检索的第一步。镜头边界的检测包括对突变的检测和对渐变的检测。然后对检测出来的镜头提取一帧或多帧关键帧来代表它的主要内容。最后利用关键帧来构造场景和逻辑故事单元。
目前越来越多的视频以压缩形式存储,如何对这些视频进行压缩域内的检索显得更加重要。本文针对MPEG视频进行了压缩域内的镜头边界检测和关键帧提取等关键技术的研究。
本文在对压缩域内的镜头边界检测技术进行深入研究的基础上,提出了一种压缩域内镜头边界精确检测的方法。首先只对压缩视频的I帧进行部分解码,取得每个8*8块的直流系数构成其相应的DC图并提取DC图的特征,然后对于突变的检测,是利用DC图特征的差异将镜头粗略切分,再利用粗略切分位置的前一个GOP内压缩码流本身所包含的B帧的运动信息来精确定位镜头边缘:对于渐变的检测利用提出的CDDC(ContinuousDifferenceofDC-picture)算法粗略定位渐变的范围,再对粗略检测出的渐变范围内P帧的帧内编码宏块的变化进行分析,来精确定位渐变的起始帧与结束帧。这样,利用压缩码流中B、P帧的运动信息分别对突变镜头和渐变镜头进行精确定位,弥补了压缩域中镜头定位精确性不高的缺点,使得本文中采取的算法具有效率高,精确度高的特点。
对于关键帧的提取,本文中采用一种能较全面反映视频内容变化的关键帧提取方法,即根据视频段的内容选取不定数量的关键帧。