论文部分内容阅读
随着互联网和多媒体技术的高速发展,人类拥有的信息量以指数函数的速度急剧增加。在线视频服务,如YouTube和优酷的兴起,表明了视频不再是传统广播电视媒体的专门领域。视频已经成为了许多人通过网络和手机交流的媒介。用户应该如何在浩瀚的数据海洋中快速、准确地获取自己感兴趣或者需要的内容显得至关重要。传统的基于关键词或者视频内容标注的视频检索方法因为描述能力有限、主观性强、人工标注繁琐等原因,已经无法满足海量视频检索的需求。近年来,基于内容的视频分析和检索技术成为当前多媒体领域的热点。它能够在没有人工参与的情况下,自动提取并表示视频的特征以及内容。不同于传统的基于标注的检索方法,基于内容的视频检索融合了图像处理、模式识别、机器学习等学科的知识。 本论文围绕这一领域做了以下研究工作: 一、将复杂的数字视频进行结构化表示。对视频进行采样,固定帧数,调整其像素点,将原视频数据采用统一结构表示。通过SIFT、PAC和MultiV LAD等方法对视频进行特征提取、特征降维和特征聚合,完成对整个视频的编码表示。 二、对视频的内容进行检测是基于内容的视频检索研究的第一步。视频数据就像一段连续的时序信号,本文结合信号模式识别领域的关联性识别方法,提出了一种基于卷积时序编码的方法,可以对具有相似内容的视频进行检测,并且通过将视频特征序列从时域转换到频域,去掉部分高频特征从而达到对视频特征序列的压缩。 三、为视频数据库建立了快速索引模型。本文通过研究分析了近似最近邻问题,采用乘积量化算法,通过非对称距离计算和与倒排索引方法相结合建立了一个高效、快速的索引模型。 四、将卷积时序编码与基于乘积量化的索引模型结合起来,建立一套基于内容的视频检索系统,并在不同的数据集和任务的条件下,对上述系统进行了实验测试。实验结果表明,该方法对目前其他主流基于内容的视频检索方法在准确率、内存消耗和查询速度上均有不同程度的提升。 五、根据提出的方法设计并且实现了一个基于内容的视频检索系统,该系统的运行结果与实验结果一致。