论文部分内容阅读
随着数字媒体技术和计算机网络技术的迅猛发展,互联网上在线图像的飞速增长,在浩如烟海的图像数据资源中迅速精准地查找所需的图像数据却变得越来越难以实现。因此,如何对图像信息进行自动化分析和理解,进而快速、准确、全面地从纷繁复杂的的海量图像中检索、甄别出所需的内容,最终实现分析、归纳、追踪等应用,是大数据环境下亟待解决的问题。 感知哈希的研究溯源于数字水印技术,借鉴了传统密码学领域的哈希理论和多媒体的认证理论等相关领域的概念。从特征提取和哈希值构造角度出发,目前的研究重点主要着眼于保证哈希值对图像压缩、缩放和滤波等内容保持性操作的鲁棒性,也就是既保证哈希码的内容敏感性也保证哈希码的感知鲁棒性,为图像检索提供了更为高效、有效的解决方式。然而,由于大规模环境下图像数据量庞大,使得相关感知哈希的研究具有其自身的特殊性和复杂性,其性能要求更高,导致现有图像感知哈希算法难以应对大规模环境下图像检索对鲁棒性、区分性和紧凑性等方面的需求,成为阻碍该技术研究与应用进一步发展的主要因素。可见,研究大规模环境下面向图像检索的感知哈希算法,是一项极富挑战性的研究难题。 针对面向图像检索的感知哈希算法目前存在的问题,首先讨论并分析了现有视觉词汇生成方式的局限性,提出了一种基于二值指纹的视觉词汇生成方法,并构建了一个高效的搜索体系框架,用于图像检索。为了构建指纹,首先,通过对局部特征进行置乱和降维,提取一个32位向量并将其转化为一个数;然后,通过进行直方图相交来度量两幅图像之间的相似程度。该方法避免了耗时的图像局部特征聚类过程,且指纹构建复杂度低,从而具有较高的效率,相较于传统的基于视觉词汇理论的大规模图像检索系统,卓有成效地提高了检索的速率。此外,基于指纹的视觉词汇比基于聚类的视觉词汇更具辨识力和精确度,因为视觉词汇量既足够大又能保持高效。 随后,将机器学习引入视觉词汇生成过程,研究了基于线性判别分析的的图像哈希算法。该方法一方面通过线性判别分析同时达到增大类间差异和减小类内差异的目的,进而增加视觉词汇的辨识力;另一方面利用机器学习的方法在小规模数据集上学习得到哈希函数,能对任意新来的图像进行快速哈希,生成紧凑的哈希码,从而大大加快了在线检索的速度。通过与已有方法进行实验对比,证实了该方法的可行性、有效性和优越性。 机器学习能有效简化哈希过程本身,从而提高检索效率。但现在哈希算法中的语义损失等问题仍是不可忽视的问题。针对语义损失,本文提出了一种基于数据感知的哈希方法,不仅探索了特征数据的局部结构,还将数据间局部结构的重建误差和映射误差结合起来,构建了一个综合优化的目标函数,并通过迹优化求解出一个初始优化解。然后,为了进一步优化这个目标函数,我们提出了两种方法,分别是通过特征融合和迭代局部搜索来进一步优化求解,从而以达到进一步降低语义损失的目的。实验表明,所提算法能有效搜索出相似图像,并优于现有的大多哈希方法。 通过本文的研究,我们提出了一系列有效解决图像检索应用中针对大规模图像感知哈希问题的方法。但展望后续研究,我们仍需进行探索和完善,考虑从图像特征学习、用户反馈信息理解、迁移特征编码等方面来提高图像检索系统的性能。