论文部分内容阅读
随着互联网上视频量的爆发式增长,视频拷贝检测对于数字版权保护、媒体内容跟踪、跨媒体内容的检索都有着重要的意义。基于内容的视频拷贝检测(Content Based Copy Detection)简称视频拷贝检测(CBCD),其目标是判断一个经过视频变换处理的查询视频是否拷贝了某一参考视频中的内容,如果发生了拷贝,那么如何精准的定位出拷贝在查询视频和参考视频中出现的位置。基于序列匹配和基于帧融合的方法是当前视频拷贝检测的两个主流方法。由于基于序列匹配的方法以一个固定窗口为检测单元,其不能灵活处理长视频流中子片段拷贝检测的情况。而基于帧融合的方法利用时间一致性信息为查询序列构造一段参考序列,很好的解决了这一问题。然而,基于帧融合的拷贝检测方法又引入了一些新的问题。首先,由于需要处理大量的返回参考帧而使该方法具有较高的时间复杂度,而一个典型的平均采样策略不仅进一步增加了帧融合的计算复杂度,还增大了拷贝检测的虚警率。其次,典型帧融合算法的输出通常是一条反映了拷贝片段发生位置的路径,这些路径是由参考视频关键帧组成的,然而这些路径并不都是拷贝发生情况的真实反映,也就是存在虚假路径的问题。为了解决帧融合拷贝检测方法的以上问题,本文在以下方面开展了研究:1.提出两种基于临近帧相似性的帧过滤策略。一种方法利用VLAD描述子对图像进行描述,动态的判定需要依次比较的两个关键帧,最后通过阈值判定需要过滤的帧;另一种方式在镜头内直接比较两相邻帧距离,再保留每一镜头内的首尾两帧。利用两种方式对参考视频和查询视频进行过滤,显著缩减了冗余帧,保持了较高定位精度。2.提出了一种基于连续性约束的路径验证算法。该算法通过判断交叉路径上查询帧和参考帧的连续性分数累加和来检验路径真伪。利用此方法对帧融合算法输出的拷贝路径进行验证,可以显著提高拷贝定位的准确性。3.提出一种新的基于帧分块融合的拷贝检测算法。该算法通过融合每一时刻的返回列表中所有分块搜索的结果,并利用一种区域交叉连续约束来约束时间一致性,从而提高拷贝检测定位的精度。实验结果表明,本文中提出的方法可以有效的提高视频拷贝检测的整体准确率和定位精度。