基于深度二值哈希的图像检索方法研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:danyuhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的蓬勃发展,各种网络图像和视频数据量呈现爆发增长,而对应的数据标签信息也越来越难获得。因此如何根据用户的不同需求,在海量的缺乏标签信息的图像数据中高效快速地检索出目标图像是一大挑战。由于图像哈希方法具有图像存储空间极低,计算简单且检索速度快等优点,而深度卷积神经网络可以同时提取到图像的局部特征以及传统算法很难获取的高层语义特征,因此结合深度学习和二值哈希的图像哈希检索方面的研究也受到越来越多的关注,然而其在图像特征融合表达、检索性能等方面仍然未能取得令人满意的结果。鉴于此,本文主要围绕基于深度二值哈希图像检索进行了研究,主要工作如下:(1)提出了结合视觉词袋的SIFT尺度特征与深度卷积特征融合方法。图像检索重要先决步骤是获得有效的图像表征,当前图像特征提取方式主要分为手工特征提取和深度特征提取。手工特征提取包含有SIFT、Bow、LBP等特征方法,而深度特征提取主要是利用深度卷积网络进行提取,目前主流方式是用深度特征完全取代手工特征,但这并不代表手工特征完全没有可取之处,尤其是在缺少标签信息的无监督学习的情况下。本文针对无监督图像检索中图像特征表达能力不足的问题以及端到端的深度特征更多的关注全局特征而对部分情况下局部信息的关注不足,本文通过对这两种方法进行分析研究,提出了结合视觉词袋的SIFT尺度特征与深度卷积特征融合方法,以将这两种特征结合起来,实验表明该方法一定程度上提升了模型的特征表达能力。(2)提出了基于对抗自编码器的无监督深度图像哈希检索方法。当前有监督深度哈希图像检索方法虽然取得了较好的性能,但是其哈希函数学习过程中严重依赖于数据集的标注信息,而现实中大部分数据都非常缺乏标注信息,因此其检索效果难以令人满意。针对这个问题,提出了基于对抗自编码器的无监督深度图像哈希检索方法,模型由编码器、判别器以及解码器组成,为编码器引入连续输出部分来弥补哈希层带来的信息损失,引入判别器使得生成的哈希码更为紧凑。在数据集MNIST、CIFAR-10、COCO-2017的实验均表明本文方法获得了较好的检索性能提升。(3)设计并实现了一个基于二值哈希的图像分布式检索原型系统。整个图像检索系统主要分为原始数据以及哈希编码索引的存储和构建、哈希模型训练、以及目标图像查询三个步骤,面临着如何存储这些海量的数据以及如何高效快速地在这些海量数据中检索出目标图像两大问题,这两个问题严重影响着实验效率和效果。为了在后续的研究工作中更好地对所提出的图像哈希算法和其他改进或者对比算法进行检索性能对比分析,本文设计并实现了一个基于二值哈希的图像分布式检索原型系统。该系统集成了本文提出的图像哈希检索算法以及部分开源算法,用户只需要通过简单的可视化操作就可以进行数据集的导入、模型训练以及检索结果个性化展示,同时系统采用插件式的架构设计,使得用户可以简单的将自己的算法最为插件集成到系统中。实验表明该检索系统能在百万级图像数据库中实现单次检索耗时小于五十毫秒。
其他文献
近年来,建筑翻译已成为翻译行业公认的一个重要领域。随着综合国力的不断增强,中国在建筑发展方面秉承“引进来、走出去”理念,这种不断交流、融合的过程扩大了对建筑类文本翻译的需求。同时,中西方在建筑理念、审美风格以及建筑材料使用等方面存在不同之处,建筑翻译可以促进中西方在建筑文化方面的传播与交流,因此意义重大。本翻译实践报告选取《回归传统:当代建筑中的就地取材与适宜技术》中第一部分的第一、二小节为翻译源
学位
千百年来,智力运动以其特有的人文魅力吸引着人民群众,在智力运动中,非完备信息博弈占据了相当大的比例,比如说常见的麻将、桥牌等,爱好者众多。目前非完备信息博弈知识多以书籍或人们口口相传的形式存在,非完备信息博弈爱好者无法快速准确获取到相关知识。同时,在人工智能决策过程中,存在着系统信息不透明的问题,使得决策的结果是正确的,但却无法被理解。为解决以上问题,本文提出并实现了基于知识图谱的非完备信息博弈智
学位
为了补充类型数据、助力保护利用、体悟设计思想,论文通过资料梳理、现场测绘、电子建模等手段,对福建永安民居允升楼和桂林堂的发生背景、相互关系及建筑形制进行了探讨。地处移民末梢的闽中亚热带山地、邻近闽江、九龙江及汀江分水岭的张坑村是允升楼和桂林堂的地理背景,明清动荡的社会治安以及朱氏家族的长期经营是允升楼和桂林堂的人文环境。根据五谷交汇、双狮把门的勺状村落环境,为了避让西侧祖屋的风水,新建的朱宅选址于
学位
钙钛矿太阳电池作为第三代新型太阳电池中的翘楚,非常具有应用前景,但其商业化程度仍然较低,只能在实验室规模上进行制备加工,为了实现其商业化的迈进,研究者们引入了各类溶液加工薄膜的方法,但最终都面临溶液转化为钙钛矿薄膜的结晶过程,而恰恰由于其中光伏相的产生与转化阻碍着如今的印刷工艺,因此这是目前钙钛矿电池中亟待解决一个共性问题,本文通过添加剂工程在本身结晶性不够好的锡基钙钛矿体系中进行探究,并结合印刷
学位
硅橡胶泡沫复合材料不仅具备了泡沫材料轻质多孔的性能,也具备了硅橡胶基体材料优异的耐热性、耐候性及化学稳定性等性能,正在成为一种应用较为广泛的新型材料。但是在硅橡胶发泡体系中,依旧存在基体材料交联硫化速率与发泡剂分解速率不一致,制备的泡沫孔径不均匀,以及体系中添加过量的补强材料导致发泡倍率较低等亟待解决的问题。为此,本论文分别采用了化学发泡法、物理发泡法以及化学法与物理法结合的混合发泡法,通过对物料
学位
随着第三代半导体的蓬勃发展,氮化镓(GaN)在LED照明领域具有重要作用。目前GaN基LED外延生长主要使用的金属有机物化学气相沉积(Metal Organic Chemical Vapor Deposition,MOCVD)技术。石墨基座作为MOCVD设备的重要耗材,在使用过程中容易受到反应气体NH3的腐蚀而掉粉失效,因此需要在石墨基座表面制备涂层。碳化硅(SiC)涂层由于良好的抗氧化性、抗热震
学位
在互联网经济蓬勃发展的时代下,电子商务的不断变化及健康发展,使消费者的消费方式逐渐由线下实体购物转变到了线上,越来越多的消费者愿意在互联网上购物。而越来越多的平台采取代理模式,即产品的零售价格由上游企业决定,而下游平台按照约定从每次销售中抽取一定比例的分成。很多企业在平台销售基础产品的同时也向消费者提供附加产品。在一定条件下,将基础产品与附加品捆绑销售时,企业往往能得到更多的利润。平台提供给客户核
学位
随着我国城乡人均收入逐年递增以及城市化发展的趋势,消费者对于健康方面越来越重视,尤其经历2020年的疫情之后,液态奶作为健康食品的代表,为消费者开启健康生活方式。目前,以互联网、电子商务兴起的新营销模式以及国家、地方政策上的集中要求,液态奶市场不仅要面临着多变的市场环境,还要面临产品的同质化、价格战日趋常态化以及新兴渠道抢占市场份额等相关问题。基于以上背景,笔者以Y液态奶昆明市主城区的营销策略作为
学位
红曲菌作为传统的药食同源微生物,可产生多种有益的代谢产物,如:红曲色素、洛伐他汀、γ-氨基丁酸等,但也会产生具有肾毒性的桔霉素,所以采用合适的方法研究红曲菌的代谢途径对促进其应用极为重要。丝状真菌的生长主要通过在菌丝的顶端延伸细胞壁和膜来实现,该过程与发生在Spitzenk(?)rper部分的胞吐作用以及发生在菌丝内的内吞作用密切相关。在真核细胞内,物质的运输是由囊泡来介导完成的。Rab蛋白是一种
学位
近年来,随着信息科技和城市智能化建设的发展,基于物联网技术的智能回收箱已在各大城市中得到广泛使用。智能回收箱的应用不仅能够提高城市居民的回收投递积极性,而且有利于标准化回收体系与绿色城市的构建。与传统的回收模式相比,智能回收模式具有回收定价明确、回收量与收益可量化程度高等特点,并且智能回收箱配备的传感系统可实现回收点与回收中心之间的通信。然而,城市居民对回收定价的敏感程度存在差异,智能回收产品定价
学位