论文部分内容阅读
随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增长,视频作为多媒体信息中最复杂一种媒体形式,凭借其多样化的表现形式、丰富的语义内容,以及便捷的记录方式得到了广泛的应用和发展。与此同时,大容量存储技术的发展,使得数字化视频信息存储的代价越来越低,进而促进了数字视频信息的大量产生和堆积。面对越来越多的海量视频库,如何快速有效地进行视频内容分析和检索就成为当前视频信息领域研究的当务之急。针对大规模视频信息检索的需要,本文从基于低层特征的视频快速检索、视频语义信息建模以及多模态信息融合视频搜索三个方面对当前视频检索研究中的若干关键问题进行了深入细致的研究。在基于低层特征的视频检索方面,本文提出了基于高维索引结构的快速视频检索算法,该方法利用高维索引结构VA-File组织视频数据库,设计了两种不同的子片段分割算法,以及新的包含视觉相似性和时序关系的视频片段相似度度量,并通过基于限定性滑动窗口的快速查询算法,在一定程度上解决了大规模视频数据库的快速高效查询问题。在视频语义信息建模方面,本文将视频高层语义特征提取分成两个部分:具体概念检测和抽象概念推理。针对抽象概念推理,本文提出了一种新的基于本体的视频抽象概念检测算法,该方法利用贝叶斯方法以及贝叶斯网络构造抽象概念检测本体,并利用本体中定义的推理规则完成视频中抽象概念的检测。该方法从语义信息学的角度对视频内容进行分析,在一定程度上消除了语义鸿沟的影响,取得了较好的查询结果。在多模态信息融合的视频检索方面,本文设计了一种基于关系代数的多模态信息融合的视频检索模型,该模型充分利用视频包含的文本、图像、高层语义概念等多模态特征,构造了对应于多个视频特征的查询模块,并创新地使用关系代数表达式对查询得到的多模态信息进行融合。实验证明,利用该视频检索模型对视频片段进行检索,能够取得优于基于逻辑回归的线性融合的多模型视频检索方法的查询结果,特别是对于包含复杂语义的多概念综合视频查询更为有效。