基于深度哈希学习的高效图像检索研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:Oom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何从图像数据库中准确快速地检索与用户查询相关的图像,是视觉检索领域的热点研究问题。随着图像数据的爆炸式增长,基于文本的图像检索由于标注工作量增大并且标注内容极具主观性从而逐渐发展成基于内容的图像检索。在基于内容的图像检索中,需要研究的关键问题有:1)研究更能表示图像内容和图像语义的特征提取算法;2)研究如何让查询的图像特征快速匹配到海量图像特征库中距离相近的特征。基于这两个关键问题,近年来研究者结合深度卷积神经网络和哈希技术提出了深度哈希学习的方法,该方法能够提高图像检索精度和速度。但是目前提出的方法存在一些问题,如卷积神经网络哈希(CNNH)方法不能同时进行特征提取和哈希特征表示;深度神经网络哈希(DNNH)方法在训练模型前需要挑选三元组图像;保持监督语义深度哈希(SSDH)方法在训练模型时需要手动设置学习速率,训练速度慢,迭代次数多。另外,目前利用深度哈希学习来进行图像检索的算法中很少考虑通过建立哈希特征索引来提高图像检索效率。本文针对上述缺点,研究了高效的图像检索算法,主要贡献如下:1.研究了提取哈希特征的模型。在模型中的全连接层后加入哈希层,通过减少哈希层的节点个数来得到低维特征。相比与现有的方案,本文提出的模型中网络参数较少,易于训练,且在模型训练时采用AdaDelta算法,避免了手工设置学习速率,加快了模型训练的速度。模型训练完成后通过阈值函数得到汉明空间的二进制哈希特征。经过分析该模型学习到的图像哈希特征可以表示图像高层语义,并具有均匀性和类内相似性。2.构建了基于哈希特征的索引结构。在面对海量高维的二进制哈希特征时,需要建立索引结构来提高检索效率。本文基于哈希特征的均匀性以及类内相似性构建了一种索引结构,该索引结构结合了划分思想和倒排索引,通过查询算法和理论分析得出该索引的构建不仅可以提高图像检索的效率,并且能够保证在该索引下的图像检索精度与线性检索精度基本一致。在图像检索常用的公开数据集上对本文研究的哈希特征提取算法和哈希特征索引结构进行了实验。通过精度评价指标MAP表明本文研究的哈希特征提取算法在Cifar10、Mnist以及Oxford17数据集上的检索精度优于其它经典算法;在选取合适参数的前提下,通过效率评价指标ART得出本文构建的索引结构将Cifar10和Mnist数据集的检索效率提高了5倍左右,将百万数据集ImageNet的检索效率提高了20倍左右,并且在该索引下的检索精度基本与线性检索精度一致。
其他文献
本文分别提出了圆形区域和球形区域上特征值问题有效的谱Galerkin逼近。对于圆形区域,我们提出了steklov特征值问题的谱Galerkin逼近和严格的误差分析。首先,我们利用极坐标变换和变量分离技巧把原问题化为一系列等价的一维特征值问题,而且这些一维的特征值问题是相互独立的,从而可以并行地求解。然后,我们推导了极条件并根据极条件引入了相应的带权Sobolev空间。结合正交多项式的逼近性质,我们
张量理论在数据挖掘与处理、神经网络、图像处理、化学计量和心理测量、物理学中的弹性分析等领域中有着不可或缺的作用.特别地,强?-张量的判定问题作为张量理论的一个组成部分在判定多元偶次齐次多项式正定性问题中起着至关重要的作用.然而,强?-张量的判定问题存在着诸多困难.因此,判定一个张量是否为强?-张量具有重要的理论意义和实际应用背景.本文主要研究强?-张量的判定问题.首先,给出一种新的强?-张量迭代判
近年来,企业对智能客服的需求越来越旺盛。传统交互中客户需要和多个部门打交道,低效、成本高,未来交互可以通过智能客服系统来快速准确地过滤用户的大部分需求,从而减少对人
有机-金属碘化物杂化型聚合物因在光电转换、刺激响应、铁电、非线性光学材料等领域具有广阔的应用前景,成为材料科学领域研究的热点之一。特别值得关注的是可用于光信号处理
随着网络的飞速发展,在网络上表达情绪的人日益增多。现有的文本情感分析系统虽然能够正确分类大部分文本的情感极性。但是当文本中存在讽刺时,现有系统往往会产生错误分类结
基于图像的人体姿态估计是指从图像中检测人体各部分的位置并计算其方向和尺度信息的过程,计算的结果分为二维和三维两种情况,本文主要研究单张室外RGB图像的三维人体姿态估
相似性图像搜索问题是指在给定数据集中返回与查询点距离相近数据点的问题。最近邻(Nearest Neighbor,NN)搜索方法在数据点维度较低的时候表现出良好的查询效果。对于高维的数据点,由于维度灾难问题的出现,最近邻搜索方法变得极其困难。为了提升数据搜索的效率,近似近邻(Approximate Nearest Neighbor,ANN)搜索方法被提出来。局部敏感哈希(Locality Sensi
在当今信息爆炸时代,需要更多的存储介质来存储信息和数据。因为NAND FLASH的速度较快,面积较小以及存储容量较大等优点,已经被广泛地用作数字系统的存储介质,例如智能手机,电脑,固态驱动器和云存储。因此,NAND FLASH的闪存市场每年都保持着较高的增长率。随着FlASH的存储容量的增大,每个存储单元存储的数据也在不断增多,外界微弱的干扰都会导致存储状态的改变,导致存储数据的出错。存储器的可靠
21世纪以来,我国国有商业银行零售业务快速增长,产品种类日益丰富,业务渠道不断拓宽,业务范围逐渐扩大,成为我国商业银行主要的利润增长点。随着互联网技术的不断发展,我国居民的日常生活习惯被大大改变。尤其在移动互联网飞速发展的今天,我国国有商业银行的零售业务也要跟上移动互联网发展的步伐不断发展、创新。加之p2p平台、“余额宝”等宝类产品对存款市场的抢占,致使金融市场存款争夺大战不断升级,储户议价能力大
本文以“伴着”“随着”“跟着”“接着”四个表伴随义“V着”为研究对象,在共时平面描绘其语法分布、语义功能和语篇语用功能,分析共性与差异,并结合历时平面考察该组词的演化历程,探析其演化动因和机制。全文包括六章。第一章为绪论,对“X着”类词的研究现状加以评述,扼要说明本文理论基础与研究方法,并将本文的语料来源进行介绍。第二章主要对伴随义“V着”进行语法分析,论述伴随义“V着”语法功能和成员语法功能分布