论文部分内容阅读
社交网络的广泛应用产生并积累海量图像数据,如何高效地存储和管理海量图像数据已成为大数据科学研究的一项重要任务。近年,研究人员提出使用哈希算法来实现图像数据的高效处理。图像哈希算法可将任意大小的图像压缩编码成一个短小的数字序列。在实际应用中,用哈希序列代替图像本身,能有效地提高计算效率并且降低存储空间。目前,图像哈希技术已被成功应用于检索、分类和水印等方面。对于图像数据,哈希算法通常需要满足两项基本性能指标,即鲁棒性和唯一性。鲁棒性是指对于视觉相似的输入图像,哈希算法应将它们压缩编码成相同或相似的哈希序列。换言之,由于JPEG压缩和亮度调整等正常操作并不改变图像的视觉内容,因此哈希算法需要具备抵抗这些正常操作的能力。唯一性是指对于不同内容的图像,哈希算法应将它们压缩编码成不同的哈希序列。通常,鲁棒性和唯一性之间存在相互制约的关系,一种性能的提升往往不可避免地降低另一种性能。当前,由于大部分图像哈希算法在兼顾鲁棒性和唯一性之间的分类性能上存在瓶颈,导致算法在面向拷贝检测等应用时的性能受限。因此,设计兼顾鲁棒性和唯一性的高效算法是当前图像哈希研究亟待解决的一个重要问题。数据降维是通过线性或非线性映射函数将高维空间的数据映射到低维空间。通常,数据降维技术具有减少冗余信息、提高识别精度和保持数据内部的本质结构等优点。本文利用二维主成分分析、双向二维主成分分析和等距映射等数据降维技术,同时结合视觉显著模型、纹理特征提取和极坐标变换等理论,研究高效图像哈希算法,开展了四项研究工作。第一项研究工作是基于二维主成分分析和特征图的图像哈希算法,第二项研究工作是基于二维主成分分析和显著图的图像哈希算法,第三项研究工作是基于双向二维主成分分析和极坐标变换的图像哈希算法,第四项研究工作是基于等距映射和显著图的图像哈希算法。本文的主要研究成果总结如下:1.提出基于二维主成分分析和特征图的图像哈希算法二维主成分分析是一种快速有效的数据降维技术,使用该技术可学习到紧凑的图像特征。目前,二维主成分分析已被广泛应用于图像分析、人脸识别、图像融合和目标跟踪等方面。由于纹理特征可以反映图像的空间分布信息,因此基于纹理信息的特征图构造技术可以实现在不降低鲁棒性的前提下有效地提高算法的唯一性。为此,本文利用二维主成分分析和特征图技术设计了一种图像哈希算法。具体步骤如下:首先,分别从频域和空域提取预处理图像的局部相位量化特征和局部三值模式特征,并用它们构造特征图。其次,采用二维主成分分析对特征图进行降维处理,从特征图中学习紧凑特征。最后,对紧凑特征进行压缩量化生成图像哈希。实验表明该算法能较好地兼顾鲁棒性和唯一性,并且分类性能和拷贝检测性能均优于多种先进的图像哈希算法。2.提出基于二维主成分分析和显著图的图像哈希算法二维主成分分析可以快速学习具有区分性的低维图像特征。显著图能够体现人类视觉系统所关注的重要区域,采用显著图构造图像哈希能够提升算法鲁棒性。目前,显著图理论已被成功应用于图像质量评价、图像分类和图像检索等方面。为此,本文利用二维主成分分析和显著图理论设计了一种高效的图像哈希算法。具体步骤如下:首先,利用基于亮度对比的视觉显著模型计算输入图像的显著图。其次,对显著图分块并将二维主成分分析应用于每个图像块,得到低维特征矩阵。最后,计算低维特征之间的距离并量化生成哈希序列。实验表明该算法能有效地平衡鲁棒性和唯一性之间的性能关系。与一些经典的基于数据降维的哈希算法相比,该算法具有更高的计算效率。3.提出基于双向二维主成分分析和极坐标变换的图像哈希算法旋转变换是一种常见的图像处理操作,识别旋转攻击下的相似图像是当前哈希研究亟待解决的一项难题。为此,本文利用极坐标变换和双向二维主成分分析提出一种抗旋转变换的图像哈希算法。该项研究工作首先从理论上证明双向二维主成分分析技术具有平移不变性。该性质的发现为设计抗旋转变换的图像哈希算法奠定理论基础,同时也对其他图像处理问题研究有一定的借鉴作用。其次,联合极坐标变换和双向二维主成分分析技术设计了一种旋转不变的低维特征提取模型。最后,利用双向二维主成分分析输出的低维特征的向量距离构造哈希。实验表明该算法对图像旋转攻击具有较好的稳健性,并且在旋转攻击下的图像拷贝检测应用有良好的性能表现。4.提出基于等距映射和显著图的图像哈希算法等距映射是一种快速有效的非线性降维方法,已被广泛应用于计算机视觉、节点定位和数据可视化等方面。利用等距映射技术能发现图像内部的几何特征,而使用频率调谐视觉显著模型提取的显著图可以反映人类视觉系统关注的重点区域,对噪声具有较好的鲁棒性且运行速度较快。为此,本文联合等距映射和频率调谐视觉显著模型设计出一种图像哈希新算法。该项研究工作的一个重要贡献是通过频率调谐视觉显著模型生成显著图来保证算法的鲁棒性,另一个重要贡献是利用等距映射从显著图中学习具有区分性的图像特征,从而保证算法的唯一性。实验表明该算法在鲁棒性和唯一性之间取得较好的分类性能,并且图像拷贝检测性能优于一些主流的图像哈希算法。