基于深度哈希学习的大规模图像检索

来源 :西南大学 | 被引量 : 0次 | 上传用户：ycgwx

【摘要】

：

图像检索技术在搜索引擎、电子商务、医学领域、搜索引擎以及工业等领域具有重要的地位。近年来,随着互联网技术的高速发展,尤其是微博、豆瓣等社交网络的流行,图像、视频、

【作者】

：

王贵军

【出处】

：

西南大学

【发表日期】

：

2004年期

【关键词】

：

深度学习哈希学习图像检索深度残差网络 ITQ

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像检索技术在搜索引擎、电子商务、医学领域、搜索引擎以及工业等领域具有重要的地位。近年来,随着互联网技术的高速发展,尤其是微博、豆瓣等社交网络的流行,图像、视频、音频、文本等异构数据每天都在飞速的增长。针对这些包含丰富视觉信息的图片,如何在这些海量的图像库中快速、准确地检索到用户所需的图像,成为计算机视觉与信息检索领域研究的热点。基于哈希学习的图像检索方法,已成为图像检索的利器,将成为海量图像检索的有效解决方案,将人们从需要耗费大量人力、物力和财力中解放出来。未来互联网上的图像还会不断增加,图像检索技术将在这些领域发挥越来越重要的作用。图像检索可以分为基于文本的图像检索(Text Based Image Retrieval,TBIR)和基于内容的图像检索(Content Based Image Retrieval,CBIR)。基于文本描述的方式需要人工标记图像文本内容,因此仅适用于小规模的图像数据,对大规模图像数据标记需耗费大量的人力与财力;目前大多数学者对于图像检索的研究主要偏向于基于内容的图像检索。基于哈希算法的图像检索方法,将图像从高维特征映射至低维的海明空间中,生成一个低维的二进制哈希编码序列,表示一幅图片。避免了高维特征产生维数灾难、降低了检索过程中计算内存的要求,能够快速响应用户检索,成为解决大规模图像检索有效解决方案。针对以上问题,本文借助于深度哈希学习方法来学习图像的二进制哈希编码。深度学习是一种强大的特征学习算法模型,能够从底层数据通过学习,提取数据之间的潜在关系,抽取图像的高层语义信息,具有强大的特征学习能。在信息检索中,哈希学习是一种高效的算法,哈希学习通过哈希函数将原始的高维特征数据映射至一个低维的海明空间,形成一个紧凑的二进制编码序列。其特征的表示不仅得到简化,并且在进行相似性度量时,还能够运用海明算法进行快速地比较,大大地提升了检索的速率,达到了检索的实时性要求。本文主要的工作包括2个方面:(1)基于深度残差网络的一种端到端深度哈希学习模型。由于卷积神经网络能很好地提取图像特征,进行分层表示,目前卷积神经网络已成功应用于人脸识别、图像分类、目标检测等应用领域,借鉴深度学习模型中的深度残差网络(ResNet)提取图像的特征,能够很好地表达图像,再嵌入标签语义信息进行哈希学习,得到图像的哈希值。降低了图像的维数,减少了存储空间和加快了检索速度。为了验证新模型的性能,本文在多种图像数据集上实验,并与多种主流的哈希学习算法进行对比。实验结果证明,这种端到端的深度哈希学习方法取得很高的检索精准度,同时对于精细分类的图像数据检索也取得了很不错的效果。(2)基于深度残差网络和量化迭代(ITQ)算法的大规模图像检索模型。在借鉴深度残差网络提取深层次特征后,再使用ITQ哈希学习算法,得到所需的紧凑的二进制哈希编码。算法在多种图像数据集上进行实验,并与多种主流的图像检索模型进行对比。实验结果证明,相对于传统方式,该方法利用深度学习提取特征值可以提高图像的检索精准度。

其他文献

浅谈小学数学课堂练习有效设计策略

<正>数学练习是小学数学教学的一个重要组成部分,学生在课堂练习中将所学到的知识在实践中加以运用,检验自己对所学知识的理解程度,教师在课堂练习中及时获得反馈信息,以便进

期刊

数学课堂练习数学学习学习数学有效设计

基于热电气融通及储能的分布式能源网络优化调度研究

分布式能源系统能够合理有效利用清洁与可再生能源,被认为是解决能源危机和环境污染问题的一个重要途径。但由于传统分布式能源系统通常为“点对点”供应,供给与负荷两端的波动性容易导致供需错位,从而降低其潜在的节能减排功效。为解决上述问题,诞生了分布式能源网络概念,其以能源融通方式连接区域内多个分布式能源系统,并集中调度能源网络内供能关系,以达到区域内能源供需之间的动态平衡。其中,优化调度过程是提升分布式能

学位

分布式能源网络优化调度储能热电气融通粒子群优化算法

稀土掺杂Tarkall-C合金多尺度设计及计算

为研制应用于船用低速机缸套的新型铸铁材料,提出多尺度设计稀土掺杂Tarkall-C合金,使其符合设计使用要求。本文主要使用多尺度模拟方法,从第一性原理计算及有限元模拟两个方

学位

多尺度设计稀土掺杂第一性原理有限元理论模型

对以生理指标评定心理状态的某些探讨

以生理指标评定运动员的心理状态在实际应用中有时因某些因素的影响而使其复杂化了。文章就其中一些问题如对生理指标变化的非单一对应性结果的解释、自主生理反应的特导性、

期刊

心理状态评定唤醒水平自主生理反应特异性皮电导

无种壳西葫芦及其栽培技术

期刊

地膜覆盖栽培播种期人工辅助授粉

止血带在战伤出血及其模拟培训中的应用现状

目的止血带及时有效的运用可有效降低四肢大出血的死亡率,挽救出血所致的战伤潜在可存在者(potentially survivable,PS)生命;而止血带在战伤中的应用和相关培训仍在不断更新

期刊

战伤出血止血带培训模具增强现实

利用无机硫源合成2-氨基苯并噻唑衍生物与2,4-二取代噻吩化合物的研究

含硫杂环化合物,如2-氨基苯并噻唑和噻吩,是一类重要的有机化合物,广泛存在于天然产物和生物活性分子中,在合成化学和制药工业中有着广泛的研究和应用。近几年以来,使用无机

学位

2-氨基苯并噻唑噻吩硫化钾铜催化无过渡金属催化

虚拟网红的IP化生存路径

当下,网红的发展模式日渐成熟,虚拟网红异军突起,熊本熊、Line Friends、吾皇等虚拟形象IP陆续闯入人们的视野。熊本熊和Line Friends从势能、魅力人格体、社群和仪式感四个

期刊

虚拟网红形象IP泛IP化内容生产

酵母多糖对哺乳犊牛生长性能及胃肠道发育的影响

为研究不同添加水平酵母多糖对哺乳犊牛生产性能、瘤胃发酵参数、胃肠道发育及消化酶活性、瘤胃微生物区系以及免疫相关基因表达的影响,试验选用56头健康的、初生重相近的荷

学位

酵母多糖哺乳犊牛生长性能瘤胃发酵胃肠道发育消化酶活性瘤胃微生物区系

柱塞泵预紧力对滑靴回程盘影响的仿真分析

轴向柱塞泵中滑靴的倾覆偏磨、回程盘的磨损与其所受应力大小有关。为改善二者的磨损性能,研究预紧力增大对滑靴、回程盘应力变化特性的影响。通过对A4VG125型柱塞泵中心弹簧

期刊

轴向柱塞泵滑靴回程盘中心弹簧预紧力ADAMS

基于深度哈希学习的大规模图像检索

其他学术论文