论文部分内容阅读
基于内容的视频检索技术通过镜头边界检测、关键帧提取、特征提取、特征匹配等方法对数字视频作出摘要、浏览和检索,实现对海量视频信息的有效管理。镜头边界检测技术正是基于内容的视频检索系统的关键技术。传统的基于像素域的方法通过统计图像帧像素间的差异,对视频镜头进行分割。而基于MPEG压缩域的方法利用压缩视频的特性,无需完全解压即可实现对镜头边界的检测,大大提高了检测效率。新一代视频编码标准H.264/AVC具有良好的压缩性能和网络适用性,其应用日益广泛。由于H.264/AVC采用了帧内编码、多尺寸块分割、多参考帧等新技术,现有的镜头边界检测方法无法直接应用于H.264/AVC压缩码流。基于此,本文对在H.264/AVC压缩域中直接检测镜头边界技术进行了深入的研究。本文首先分析了像素域和MPEG压缩域中经典的镜头边界检测算法,总结了当前H.264/AVC压缩域镜头边界检测技术研究现状与存在的问题,在此基础上提出了一种基于预测模式差异的镜头边界检测算法(PMD算法,A ShotBoundary Detection Algorithm Based on Prediction Mode Difference)。该算法从H.264/AVC码流中直接提取帧预测模式信息,通过统计相邻帧对应块之间的预测模式差异,实现对不同类型视频镜头的边界检测。其创新点主要体现在以下两个方面:(1)针对现有镜头边界检测方法的不足,充分利用H.264/AVC标准的新特性,提出了一种利用帧预测模式差异信息来检测H.264/AVC视频镜头边界的新方法,首先对图像帧块分割做归一化处理,然后利用相邻帧对应块之间的帧内或帧间预测模式差异来检测镜头边界,检测效果好且计算复杂度低。(2)针对现有算法难以同时检测发生在不同类型编码帧中的镜头转换的问题,对所有图像帧采用统一的检测框架,不仅能检测发生在I帧的镜头转换,而且对于发生在P、B帧的镜头转换也可精确定位其转换图像帧号。实验结果表明,提出的算法不仅能有效地检测镜头突变转换,对于渐变转换也能取得令人满意的查全率和查准率。