论文部分内容阅读
随着互联网的快速发展与移动设备的普及,线上线下的图像数量呈指数形式增长。面对当前海量复杂的图像数据,如何从中快速的寻找到需要的图像数据,是当前图像检索任务的一大难题。近年来,大规模图像检索中的哈希学习方法越来越受到人们的重视,并在图像检索任务中取得了较好的检索准确率。但是受限于手工特征对图像表达能力的不足,以及不同的哈希函数对特征矢量进行量化时产生的较大误差,目前的哈希学习方法还有许多需要改进的地方。对于大多数现有的有监督哈希方法,特征学习和哈希码学习过程是分离的两个步骤,这既不能学习到最优的哈希码也不能产生可区分性高的特征表达。考虑到现有哈希学习方法的上述缺陷,本文提出一个有监督的深度哈希网络模型用于图像检索任务,主要研究内容包括以下几方面:1.将预训练好的VGG16模型作为基础,使用检索数据集对迁移的网络模型进行微调。同时对网络模型去掉最后一个全连接层并添加哈希学习层及权重学习层,构成了本文的端到端的深度哈希网络模型来对图像特征矢量及哈希码进行同时学习。2.利用标签对信息作为网络模型训练过程中的监督信息对相似图像间的相似性进行保存学习,使得相似图像对通过网络学习到的哈希码之间的距离尽可能的小。在权重学习层对哈希码对应位上的自适应权重进行学习,从而可以直接通过权重大小比较来筛选出较短位数的哈希码,大大的节约各不同位数哈希码的训练时间。3.在哈希学习过程中提出了改进的目标函数来学习更好的哈希码。并利用正则项及tanh-like激活函数对网络学习过程中离散优化问题所引起的量化误差进行降低,提高网络模型学习到的哈希码的质量。