论文部分内容阅读
在当前的互联网时代,随着终端设备和移动互联网的不断发展,用户可以便利的获取和发布视频,与此同时,随着各种视频处理软件不断增多,用户可以方便地对视频进行各种操作,例如编码格式的改变、亮度以及对比度的变化、尺度放缩、旋转剪切、添加logo等,这些便利的工具在丰富人们文化娱乐生活的同时,也使得互联网中各种内容相似或相同的视频拷贝越来越多,为提高视频检索效率,规范视频消费环境,视频拷贝检测技术应运而生,并逐渐成为多媒体数据处理领域的研究热点。视频哈希是视频拷贝检测领域的核心技术,视频哈希提取视频的内容特征,并把内容特征映射为简约的二值哈希序列。视频哈希是视频内容的标识符,根据不同的视频哈希之间的距离,可以判断视频是否为原始视频的拷贝。本文首先介绍视频拷贝检测以及视频哈希的基本知识,包括视频拷贝检测的定义、视频哈希的定义、性质以及评价标准,然后提出一种基于特征融合的视频拷贝检测算法,本文的主要贡献有以下两点:(1)利用高阶张量对视频建模,融合视频的全局、局部和时间特征,获取视频的多特征融合表达方式。与现有的单特征视频表示方式和多特征向量拼接的视频表示方式相比,本文算法提出的多特征融合方式更好的利用了视频不同特征之间的关联关系。为充分表征视频的内容,本文融合了视频的全局特征、局部特征和时域特征,提取灰度直方图作为全局特征,加速鲁棒特征点作为局部特征、归一化的相邻帧间像素差作为时域特征,并构建视频张量,通过张量分解得到三个一阶张量作为视频的特征。(2)利用曼哈顿量化方法进行视频哈希学习,获取哈希序列。与传统的欧式距离和汉明距离相比,曼哈顿量化采用的距离度量方式更能体现原始空间数据点和哈希空间数据点之间的结构相似性。另外,传统哈希量化方法对原始特征的所有维度无差别编码,忽略了特征不同维度量纲的不同,破坏了原始特征之间的结构相似性,本文算法对原始特征的每个维度分别编码,很好地保持了结构相似性。