论文部分内容阅读
随着网络上视频数量的增长,网络视频中往往存在着大量重复的(duplicate)或近似重复的(near-duplicate)视频。这些大量的重复视频不仅浪费了存储空间,也给视频的有效管理带来不便,并且给用户在网络上搜索感兴趣的视频时返回过多的重复结果。因此,为了提高网络视频的管理、检索及浏览效率,高效的视频重复检测方法就显得十分必要。除此之外,视频重复检测技术还具有广阔的应用前景,包括新闻图像或新闻视频的跟踪、商标侵权检测等等。
本文重点研究基于内容的网络视频重复检测方法。传统的视频重复检测方法是基于文本的检索方法,这类方法需要大量的人工标注。而基于内容的检测方法包括基于全局特征的方法和基于局部关键点匹配的方法。基于全局特征的方法其特点是检测速度快,对那些几乎完全相同的视频或者具有简单场景的视频能取得较好的检测结果,但是很难检测那些在内容上做了一些改变(颜色、光照、插入或删除了若干帧等)的重复视频。而基于局部关键点的方法虽然能较准确地检测那些具有复杂场景的视频,但是检测过程非常耗时。而视频检索系统不仅要求精确率还要求实时性。因此,本文提出了一种新的基于镜头层比较(Shot LevelComparison,SLC)的精确最近邻查找的视频重复检测方法(SLC+NNS),该方法在镜头层定义了一个新的特征:镜头签名(Shot Signature),然后将视频的镜头看作一个比较单元,通过视频间匹配镜头的比例来判断视频的相似性。除此之外,为了进一步提高SLC+NNS方法的检测速度,本文将LSH近似最近邻查找技术用于镜头层比较来快速查找相似镜头,得到了基于镜头层比较和LSH技术的快速视频重复检测算法(SLC+LSH)。实验结果表明,使用本文的SLC+NNS方法,得到了很好的检测性能,并且速度很快,特别是对于复杂场景的视频重复检测性能明显优于基于全局特征的方法(Sig-CH)·[17]和基于上下文的方法(CONT+CONX)·[3],而且在准确性上与目前最好的基于局部关键点匹配的HIRACH方法[4]几乎完全一样,但速度比HIRACH方法快数万倍。而结合LSH技术后的SLC+LSH方法,在准确率没有明显下降的情况下,速度比SLC+NNS方法提高了很多倍。