论文部分内容阅读
随着计算机技术、多媒体技术的快速发展,信息量大增,人们对信息的需求也越来越多,多媒体信息由于其直观性强,内容丰富受到广大群众的喜爱,已经成为人们日常生活工作的主要数据来源之一。近年来视频互动应用的流行引发了基于内容的视频分析的研究热潮,人们对多媒体信息的需求转向了以基于内容的访问、检索和操作为特征的交互式视频服务、娱乐视频应用以及各种媒体的视频点播等。视频信息虽然丰富但是由于其未结构化的数据特点,无法直接使用关键字检索,如果手工注释,工作量是非常大且具有相当的主观随意性。如果视频可以有一个结构化的元数据索引,就可以对视频内容进行精细颗粒度的控制管理。体育比赛的电视转播一般很漫长,对应视频数据的关系复杂且数据量庞大,对于观众来说,真正关心并有可能反复观看的只是其中的精彩部分,如何对视频数据进行有效组织,采取何种策略进行体育视频数据的管理,以及如何在漫长的比赛视频中,帮助用户精确定位感兴趣的视频片断或精彩镜头,并提供丰富的浏览功能对充分发挥体育视频的作用是很关键的。由于MPEG-4和MPEG-7等标准的提出使理解和提取语义视频信息成为视频压缩、检索等领域中非常重要的一个研究方向。尽管利用各种区域特征进行图片分割的研究已经取得了很大成效,但从众多视频资源中提取语义对象,建立具有健壮性的多层次的语义信息树还是一个亟待研究的课题。利用现有的视频分割提取及内容分析技术,合理结合体育视频的领域知识建立具有一般性、可扩展性的体育语义视频元数据描述模型,研究并应用基于具体模型和内容的多层次语义视频元数据提取算法是本文的主要工作。本文的主要思路是:首先在前期的研究基础上,对体育视频的语义信息描述模型进行研究和探讨,提出一种基于内容的多层次视频元数据描述模型,并基于该模型采用多层次提取算法。具体过程如下:首先进行镜头检测,将视频序列分为一个个镜头的组合;在每个镜头组合中提取关键帧,利用关键帧的元数据描述作为整个镜头的描述;用视频分割算法,区分出帧中的对象;用相邻帧中对象的特征空间聚类,识别相同对象,跟踪对象运动,生成对象关联描述。最后基于以上分析研究实现体育视频元数据提取系统。