面向图像检索的感知哈希算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kingzdh410
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字媒体技术和计算机网络技术的迅猛发展,互联网上在线图像的飞速增长,在浩如烟海的图像数据资源中迅速精准地查找所需的图像数据却变得越来越难以实现。因此,如何对图像信息进行自动化分析和理解,进而快速、准确、全面地从纷繁复杂的的海量图像中检索、甄别出所需的内容,最终实现分析、归纳、追踪等应用,是大数据环境下亟待解决的问题。  感知哈希的研究溯源于数字水印技术,借鉴了传统密码学领域的哈希理论和多媒体的认证理论等相关领域的概念。从特征提取和哈希值构造角度出发,目前的研究重点主要着眼于保证哈希值对图像压缩、缩放和滤波等内容保持性操作的鲁棒性,也就是既保证哈希码的内容敏感性也保证哈希码的感知鲁棒性,为图像检索提供了更为高效、有效的解决方式。然而,由于大规模环境下图像数据量庞大,使得相关感知哈希的研究具有其自身的特殊性和复杂性,其性能要求更高,导致现有图像感知哈希算法难以应对大规模环境下图像检索对鲁棒性、区分性和紧凑性等方面的需求,成为阻碍该技术研究与应用进一步发展的主要因素。可见,研究大规模环境下面向图像检索的感知哈希算法,是一项极富挑战性的研究难题。  针对面向图像检索的感知哈希算法目前存在的问题,首先讨论并分析了现有视觉词汇生成方式的局限性,提出了一种基于二值指纹的视觉词汇生成方法,并构建了一个高效的搜索体系框架,用于图像检索。为了构建指纹,首先,通过对局部特征进行置乱和降维,提取一个32位向量并将其转化为一个数;然后,通过进行直方图相交来度量两幅图像之间的相似程度。该方法避免了耗时的图像局部特征聚类过程,且指纹构建复杂度低,从而具有较高的效率,相较于传统的基于视觉词汇理论的大规模图像检索系统,卓有成效地提高了检索的速率。此外,基于指纹的视觉词汇比基于聚类的视觉词汇更具辨识力和精确度,因为视觉词汇量既足够大又能保持高效。  随后,将机器学习引入视觉词汇生成过程,研究了基于线性判别分析的的图像哈希算法。该方法一方面通过线性判别分析同时达到增大类间差异和减小类内差异的目的,进而增加视觉词汇的辨识力;另一方面利用机器学习的方法在小规模数据集上学习得到哈希函数,能对任意新来的图像进行快速哈希,生成紧凑的哈希码,从而大大加快了在线检索的速度。通过与已有方法进行实验对比,证实了该方法的可行性、有效性和优越性。  机器学习能有效简化哈希过程本身,从而提高检索效率。但现在哈希算法中的语义损失等问题仍是不可忽视的问题。针对语义损失,本文提出了一种基于数据感知的哈希方法,不仅探索了特征数据的局部结构,还将数据间局部结构的重建误差和映射误差结合起来,构建了一个综合优化的目标函数,并通过迹优化求解出一个初始优化解。然后,为了进一步优化这个目标函数,我们提出了两种方法,分别是通过特征融合和迭代局部搜索来进一步优化求解,从而以达到进一步降低语义损失的目的。实验表明,所提算法能有效搜索出相似图像,并优于现有的大多哈希方法。  通过本文的研究,我们提出了一系列有效解决图像检索应用中针对大规模图像感知哈希问题的方法。但展望后续研究,我们仍需进行探索和完善,考虑从图像特征学习、用户反馈信息理解、迁移特征编码等方面来提高图像检索系统的性能。
其他文献
注意是一个多学科交叉的研究领域,近年来受到从事神经生理学、认知心理学、计算机视觉和计算神经科学研究的科技人员的高度关注。注意是在来源不同的各种信息同时出现时做出选
从以砖瓦型基础结构运行的商业活动转为运行在不同系统和位置的全天候商业在线活动,在Internet时代,基于Web的应用程序起到了不可估量的作用。随着电子商务的推行,越来越多的
在新一代Internet网络上,网络规模迅速地增长、网络技术不断地成熟完善,特别是多媒体业务地兴起,提供高水平服务质量(Quality of Service,QoS)是目前计算机网络研究的主要课
伴随着嵌入式技术与互联网技术的结合,信息技术将给人们的工作和生活提供更多的便利。与传统的互联网接入设备相比,嵌入式设备固有的处理能力不足、人机接口不够丰富等问题,
论文给出了两种根据人类面部图像估计其年龄的机器学习方法的原理及实现。第一种方法利用性别信息以提高年龄估计的准确度;第二种方法利用幼年与成年的预分类帮助进行年龄估计
互联网的快速发展,极大改变了人们的生活习惯,带动了移动互联产品的发展。市场上出现了越来越多的嵌入式产品,不同嵌入式解决方案提供商都提供带有自身特色的解决方案。由于解决
随着我国信息化的不断发展,数据库得到日益广泛的应用。同时,开放复杂的网络环境,使数据库中的数据受到了越来越多攻击威胁,所以,数据库安全技术研究也就成为了计算机技术研究领域
随着社会的发展,激烈的市场竞争要求企业能够快速地响应外部市场的变化。为提升企业的综合竞争力,及时处理瞬间万变的市场信息,各企业都在加快信息化建设。其中一个关键的工
实时仿真技术作为计算机仿真的应用分支,近年来伴随着计算机科学和信息技术的提高而快速发展。特别是仿真支撑软件的产业化、商品化和国际化进程中,计算机仿真已经成为现代设
本文首先介绍了分布式数据库系统的基本概念,如分布式数据库系统的定义、特点、数据分布及系统体系结构等,然后简要描述了分布式查询的处理策略、优化目标及代价估算。接着本文