论文部分内容阅读
随着数字技术和网络技术的快速发展,多媒体数据正逐渐成为人们获取信息的重要来源,使视频数据呈现爆炸式增长。数字视频数据获取容易、复制简单并且传播迅速,不仅给数据存取提供了极大的便利,而且极大提高了信息表达的效率和准确性,但大量视频的传播和篡改使数据库被多个冗余的拷贝版本占据了存储资源,大大降低了搜索的精度和速度,并严重制约了数据库管理及版权管理等应用的效率。因此,如何在大数据时代快速、准确地检测到拷贝的视频片段成为亟待解决的问题,针对该问题,基于多模态哈希学习的视频拷贝检测作为一项极具潜力的技术手段,受到了学术界及商业界的广泛关注。在视频拷贝检测中,传统的方法采用单一特征描述视频内容,缺乏广泛的鲁棒性,而利用多模态之间的互补性,设计基于多模态的视频拷贝检测可以有效抵抗多种视频攻击,提高视频拷贝检测的精度。此外,“大数据时代”的检索效率问题同样也是视频拷贝检测需要解决的难点问题,哈希化处理可以在降低数据存储空间的同时,提高检测效率。针对以上问题,论文对基于多模态哈希学习的视频拷贝检测技术进行深入研究,主要工作如下:(1)提出一种基于距离保持哈希学习的视频拷贝检测方法,在视频降采样后的关键帧中提取全局特征和局部特征,相似数据在原始特征空间中的距离应与其在汉明空间中的距离保持一致,即相似数据在原始特征空间中的欧式距离应与其在汉明空间中的汉明距离之差的平方最小化,建立目标函数,求得训练数据的最优哈希码,根据一致性保持,完成哈希函数的学习,得到一系列有辨别力的哈希函数,进而对数据库视频及查询视频进行哈希化处理,实现视频拷贝检测。(2)提出一种基于多视角哈希学习的视频拷贝检测方法,同样在视频降采样后的关键帧中提取全局特征和局部特征,从局部考虑,同一模态下,相似数据的哈希码应保持相似,并且不同模态下相似数据的哈希码也应保持相似;从全局考虑,数据在多模态下的哈希码应该与每种模态下的哈希码保持相似;此外,结合一致性保持,建立有效的目标函数,同时学习训练数据的最优哈希码及有辨别力的哈希函数,该方法从局部和全局两个视角来考虑,取得了较好的视频拷贝检测效果。实验表明,在常见的视频攻击下,本文提出的方法具有较好的检测性能,同时获得了较高的检测效率。