论文部分内容阅读
随着多媒体技术的发展,计算机性能的飞跃和网络传输速率的加快,数字视频得到了广泛地制作和传播。视频数据的爆发性增长使得快速有效地分类、浏览和检索视频成为用户的迫切需求。基于内容的视频处理与检索,致力于使用计算机技术对视频进行内容分析、语义分类、索引检索和存储管理,吸引了越来越多的科研机构和研究学者的关注。视频结构化分析是视频内容分析的先决条件,主要包括镜头分割,关键帧提取和场景聚类。因此,镜头分割和关键帧提取是整个基于内容的视频分析领域的基础和前提。如何准确地检测镜头边界,合理有效地提取视频关键帧成为国内外研究的一个重要课题。在深入分析了传统视频边界检测算法的基础上,针对体育视频的特点,实现了基于信息论的视频切变检测算法。该算法提取视频帧的颜色直方图,利用互信息计算两帧之间的相似度。针对传统方法只考虑相邻两帧的不足,利用多帧之间的互信息构造帧差;针对阈值法存在的缺陷,利用滑动窗口计算帧差和特征向量,运用支持向量机(Support Vector Machine,SVM)将镜头边界检测问题转化成模式识别中的分类问题,有效检测镜头切变。在获取镜头边界信息后,实现了基于用户注意力模型的关键帧提取算法。该算法将用户注意力分解为两个模型:动态注意力模型和静态注意力模型。动态注意力模型专注于分析视频中的运动信息,度量运动信息所形成的关注度,静态注意力模型计算图像本身的关注度,最终利用动态优先的融合方式,形成用户注意力模型,并利用该模型提取关键帧。实验结果表明,基于信息论的视频切变检测算法具有很高的查全率和准确率,能够有效检测切变边界。基于用户注意力模型的关键帧提取算法能够有效度量用户关注度,提取适当的关键帧代表整个镜头。但目前在边界检测中专注于切变检测,没有检测视频中的渐变,关键帧提取中对用户注意力建模没有考虑音频等其他特征,故未来的研究重点在于实现镜头渐变检测和建立融合音视频多维特征的用户注意力模型。