论文部分内容阅读
随着互联网的高速发展,存储设备的迭代更新,云技术的日益成熟,图像、音频、文字等多媒体信息储存逐渐方便,目前迎来了真正意义上的大数据时代。图像检索领域在拥有海量图像数据前提下,如何在海量数据库中快速准确检索出用户所需图像成为当今图像检索领域的难点与热点。近年来图像检索中,哈希技术与单特征卷积网络得到广泛运用,但目前仍存在很多缺点。针对哈希技术,有监督的哈希学习方法中特征与哈希学习的过程大多是分离的,通过此方法有以下两种问题:即学习到次优的哈希码、生成较低可区分性的特征表示;对单特征卷积网络有以下问题,基于单特征卷积神经网络只能捕捉到高层次抽象化信息,丢失局部结构信息,由此影响检索模型性能。针对以上图像检索的问题,论文总结了国内外图像检索技术的研究发展,提出一种用于图像检索任务的基于深度哈希卷积神经网络的图像检索方法、基于多层多尺度特征融合的深度哈希图像检索方法。论文主要内容如下:(1)基于深度哈希卷积神经网络的图像检索方法(DHCQ)针对特征提取和哈希码分步学习的问题,提出了一种改进的网络模型,使得在卷积神经网络中同时学习图像和哈希码的特征表示,然后利用标记的监督信息学习网络差异性特征表示,并直接用于生成哈希码和预测图像标签,根据关联的量化误差和预测误差共同调整网络的学习,最终对查询图像实现在低维空间上快速检索。实验表明,在同一个卷积神经网络模型中提取图像特征和哈希码学习的方法是切实可行的。(2)基于多层多尺度特征融合的深度哈希图像检索方法(MLSF)在图像检索任务中,模型捕捉到的高层抽象信息丰富而局部细节信息缺失问题,导致模型检索结果不能满足用户对检索图像的细节要求,进而提出了采用多层多尺度特征融合的方法,将网络模型中不同层得到的特征图进行融合。论文设计的基于多层多尺度特征融合的深度哈希图像检索模型抓取到的特征包括高层抽象信息与底层局部信息,高层抽象信息负责捕捉抽象结构,底层局部信息捕捉图像细节,又由于模型参照类似残差网络方法,模型训练速度有所提升。论文提出基于深度哈希卷积神经网络的图像检索方法、基于多层多尺度特征融合的深度哈希图像检索方法,通过哈希码与多尺度特征为不同视角缓解图像检索速度低、精度不高问题。实验结果表明,模型与现有的主流方法相比,论文提出的方法具有检索精度高和速度快的特点。