论文部分内容阅读
随着计算机技术和网络通信技术的高速发展,视频等多媒体数据已逐渐成为信息处理领域中主要的媒体形式。而网络的不断扩张及接入技术的不断发展,为视频及其他形式多媒体的广泛传播提供了广阔的空间。随着多媒体数据,尤其是视频数据的日益丰富,对视频数据的操作已经不仅局限于存储和传输,检索等应用被越来越多的人们所接受。如何从海量视频数据检索到所需信息变得越来越重要,但是传统检索方法的低效和限制使得人们亟需一种新的能处理视频数据的检索方法。传统的视频检索方法通过人工对视频进行标注,然后对标注内容进行检索。这种方法面对急剧涌现的视频内容有着很多困难,于是基于内容的视频检索技术(CBVR)应运而生。本文主要研究了基于内容的视频检索中的关键技术——镜头边界检测。本文从解压缩域和压缩域两方面介绍总结了现有的镜头边界检测方法,并分析了其中存在的主要问题,提出了将纹理特征应用到本文建立的镜头边界检测系统中;接着介绍了现有的各种纹理特征提取方法,分析及比较后决定采用分形维数作为纹理特征应用于本文建立的镜头边界检测系统;随后提出了一种改进的基于无监督聚类的关键帧检测方法,最后建立了一个基于纹理特征的视频镜头边界检测系统。该视频镜头边界检测系统主要包括三个部分——图像预处理、图像特征提取、镜头边界检测及关键帧提取。图像预处理部分主要完成对视频片段中每帧图像的滤波和分块;图像特征提取部分则利用差分盒子法对每帧图像进行纹理特征提取;视频镜头边界检测及关键帧提取部分通过滑动窗口和动态阈值提取出视频片段的镜头边界并利用一种改进的无监督聚类方法进行关键帧提取。最后通过仿真实验对本文提出的视频镜头边界检测系统进行了验证,实验证明,本系统对各类视频边界,尤其是渐变有着很好的鲁棒性,同时能够根据视频内容的不同而高效的提取关键帧。