论文部分内容阅读
近年来,随着多媒体技术和计算机网络技术的发展,全世界范围内的数字视频信息以惊人的速度在增长,对这些海量的而且包含大量非结构化信息的数据如何组织、表达、管理、查询和检索就成为迫切的需求。于是,快速而准确的视频检索技术已成为一个研究的热点,也成为未来信息高速公路、数字图书馆等项目中的关键技术。
现在已有很多基于内容的视频检索系统例如QBIC,VisualSeek,VideoQ,Informedia等,这些系统采用了各种有效的描述工具来描述视频内容的不同特征,并能在不同的应用中提供有效的解决方案。但是,这些系统中的视频数据的格式并不完全一致,从而对这些信息的特征描述也采用了不同的描述格式。这就导致了这些系统之间的元数据共享变得相当困难。
于是,MPEG组织制定的一个ISO/IEC标准MPEG-7,正式名称是“多媒体内容描述接口,目的在于为描述多媒体内容提供一个统一标准。MPEG-7对各种不同类型的多媒体信息进行了标准化描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。
本文首先着重介绍了MPEG-7的标准范围、应用领域和及其组成部分。MPEG-7标准化的部分包括系统,描述定义语言,多媒体描述模式,视觉和音频。详细描述了视觉和音频的各个描述子和描述模式,同时也具体地介绍了多媒体描述模式的各个组成部分,参考软件的各个模块和具体实现。接下来我们介绍了基于内容的视频数据处理,包括镜头边界的检测、视频特征的提取和视频场景的组织。然后分别介绍了在基于关键帧的视频检索中采用了MPEG-7的视觉特征描述子——可扩展颜色、相似纹理、轮廓形状,同时给出了这些描述子的抽取和匹配算法。在基于语义的视频检索中应用了MPEG-7中的多媒体描述模式Segment和递归分解规则来进行视频结构化内容的标注。最后在此基础上应用了基于MPEG-7的推理网络来进行视频检索。