论文部分内容阅读
随着多媒体技术、因特网传输以及数字电视技术的发展,数字视频技术已经得到广泛的应用,如何有效的存储、管理及查询所需信息已经成为亟待解决的问题,作为获取视频信息的重要手段,视频检索技术受到越来越广泛的重视。基于内容的视频检索(Content-Based Video Retrieval, CBVR)是当前多媒体领域的研究热点,其综合了模式识别、数字图像处理、数据库和人工智能等技术,克服了基于传统的文本的检索系统的缺陷。论文就CBVR中的关键技术——镜头边界检测进行了较深入的研究。本文首先介绍了基于内容视频检索技术的背景、研究现状及其发展趋势,分别总结了压缩域和非压缩域中的经典镜头边界检测算法,分析其优缺点,并在此基础上综合H.264编码规则及特征,提出了一种基于H.264视频流的镜头边界检测算法。首先通过提取宏块的帧内编码分割模式和帧间编码预测模式等信息分析相邻帧之间的相关性从而检测镜头突变,本文对图像帧内容进行了分区处理,不同的区域给予不同的权重,突出了图像帧的核心内容,有效的消除了电视电影字幕或者球赛直播看台区域发生变化对视频镜头检测造成的影响,并且在宏块信息分析上加入对双向预测编码宏块的考虑,拉大了突变帧和非突变帧的差异。然后本文提出根据图像帧前后景的平均运动活性度及帧内编码宏块数来检测镜头渐变的方法,有效的解决了以往算法中对突发的轻微局部或全局运动帧的误检问题。实验结果表明,本文算法不仅运算量小,运行速度快,对于运动强度较大的视频流也有较好效果,具备较高的查全率和查准率。