论文部分内容阅读
随着互联网的快速发展,人们对视频的需求越来越大,网络视频的数量急剧增长。丰富的网络视频在满足人们日常需求的同时,也给视频管理与视频搜索带来极大的挑战。由于视频库的庞大,导致在海量的视频库中对视频的版权、视频内容的健康与合法性进行管理造成了相当大不便。另外,因为互联网的开放程度之高,人们可以通过先进的视频剪辑处理技术对视频进行再处理并上传到视频网站中,对相关相似视频的搜索也造成了困扰。如何对海量视频库有地效管理及监测成为网络视频监管的新难点。基于视频内容的特征提取成为近些年视频检测与搜索的主要手段,通过对提取的特征点处理生成视频的唯一表示类似于人类的指纹,具有很好的区分性,基于此特性,可以较好的实现对海量视频库的有效管理与监控。本文针对此研究背景,利用SURF算法提取视频帧的内容特征,继而采用词袋模型对特征点进行再处理生成视频指纹。视频是由一组连续的图像帧组合而成的图像集合,其内容丰富,数据量大,指纹提取面临着海量的数据处理。对于视频指纹,我们要求应满足鲁棒性与准确性,但是在实际应用中,还需要满足一定的高效性来满足用户的检索需求。本文对现有的视频指纹提取算法作了分析,探讨了它们存在的问题与不足。为了提升现有的指纹提取效率,论文的主要工作如下:首先,对网络视频目前的发展趋势与面临问题进行分析,说明了论文内容研究的背景与意义,同时介绍了国内外关于海量网络视频管理及检索的研究及发展现状。接着,对于基于视频内容的视频管理及匹配技术进行了说明,并分别对基于信息隐藏技术的数字水印与数字指纹在关于数字媒体产品版权保护等方面的应用进行了讨论,主要说明了基于内容识别的视频指纹提取算法以及算法的实际性能。然后,本文为了提升视频指纹的提取速率,并减少在指纹生成过程中的计算时间与存储,本文对提取的SURF特征点进行稀疏编码处理,对原SURF特征描述子仅采用少量的非零数据来对其进行表示处理,并通过Matlab仿真平台对改进算法的效率进行验证。接着,论文采用Caltech-101库,采用Kmeans聚类算法对稀疏的SURF特征点进行聚类,生成一个较为完备的视觉词典。对于每一个视频帧出来的特征点,进行稀疏编码后,在词典中查找可以表示自己的视觉单词,然后对每一帧获得的所有单词进行词频统计并哈希生成指纹序列。文章通过Matlab以及VC仿真对视频指纹的准确性与鲁棒性进行验证。最后,本文采用Java及MySQL,结合本文探讨的视频指纹提取算法和一些经典的序列比对算法,搭建B/S模式的视频指纹检索系统,实现用户通过客户端浏览器在网络视频库中基于内容的视频片段检索。并提供了管理员接口,实现管理员对视频库以及指纹库的管理与更新。