论文部分内容阅读
哈希方法被广泛研究并应用于基于内容的图像检索领域。哈希方法旨在学习一组哈希函数将原始数据映射成一串二进制编码并在汉明空间保持数据在原始空间中的相似性。使用哈希方法生成的二进制编码来进行图像检索可以提高检索的效率,并且大幅减小存储开销。决策树是一种运行速度快,可解释性强的模型,但目前基于决策树的哈希方法由于使用浅层的决策树而造成了学习能力不足的问题。目前大多数的深度哈希方法都是基于深度神经网络设计的。考虑到基于深度神经网络的哈希方法超参数过多,可解释性差,训练过程需要昂贵且强大的计算设备,因此设计一种超参数少,可解释性好,并且训练速度快的深度哈希方法是非常必要的。多粒度级联森林是一种不同于深度神经网络的深度模型,这种模型由多粒度扫描和级联森林组成,通过将森林构建成级联结构对数据进行逐层处理。目前为止,多粒度级联森林还没有被应用到哈希学习中,因此本文提出了基于多粒度级联森林的哈希图像检索方法和基于流形相似度保持的多粒度级联森林哈希图像检索方法。为了进一步减少图像数据库的存储开销,本文提出了基于随机森林自动编码器的哈希图像检索方法。具体研究工作如下:1.针对目前基于决策树的哈希图像检索方法中使用浅层的决策树而造成的学习能力不足的问题,以及基于深度神经网络的哈希方法中具有过多的超参数,可解释性差,训练过程需要昂贵的计算设备和大规模的数据集等不足,本文提出了基于多粒度级联森林的哈希图像检索方法。该方法首先使用不同尺寸的滑动窗口扫描原始数据以提取多粒度的特征,然后采用两步学习策略——初始哈希码推理和深度森林哈希函数学习——来实现哈希映射。实验结果表明,该方法超参数设置简单,检索精度也高于基于决策树的哈希方法和基于深度神经网络的哈希方法。2.为了充分利用数据的语义标签信息和数据本身的属性信息,本文提出了基于流形相似度保持的多粒度级联森林哈希图像检索方法。该方法在构造目标函数时同时考虑了语义相似度和流形相似度,将数据从原始空间映射到汉明空间后,同时保持了数据在原始空间的语义相似度和流形相似度。在检索图像时,根据图像的内容信息可以检索到在标签语义和内容语义上同时保持的相关图像,从而获得更接近待检索图像语义信息的图像。实验结果表明,该方法的检索精度高于基于决策树的哈希方法和基于深度神经网络的哈希方法,并较基于多粒度级联森林的哈希图像检索方法有所提高,且获得了在语义上更加符合用户需求的图像。3.为了进一步减小图像检索任务中图像数据库的存储开销,本文提出了基于随机森林自动编码器的哈希图像检索方法。该方法利用随机森林自动编码器将图像检索任务分为前向编码过程和后向解码过程,前向编码过程是将数据从图像空间映射到汉明空间,后向解码过程是将哈希码从汉明空间解码到图像空间。因此,在完成前向编码后图像检索系统中无需再保存图像库,可以直接将哈希码重构成图像,从而大大减小存储开销。实验结果表明,该方法在检索精度上有所降低,但能够较好地重构图像。