论文部分内容阅读
视觉作为人类认识世界、了解世界的一个重要媒介,为人类形象生动的展示了这个丰富多彩的世界。由于当今的各种信息的数据量呈指数级的展现在人们眼前,以图像信息为例,从大数据中找到真正符合心意的图像变得越来越困难。传统的基于内容的图像检索技术,例如基于颜色、纹理、空间形状等的图像检索,虽然解决了基于文本的图像检索的工作量大、人的主观因素的影响大等缺点,但是仍不能有效提取图像的高级语义特征。因此,在当今图像信息量日益增长的形势下,高效地进行图像检索成为我们追求的目标之一。本文针对图像的深层语义特征的弱表达能力及图像特征数据的高维度的问题,提出一种基于卷积神经网络和PCA降维的图像检索方法。首先,通过迁移学习后的卷积神经网络提取图像库中图像的语义特征并构建特征库。先用Inception-v3模型在Corel、Caltech-256数据集上做迁移学习,得到迁移学习后的卷积神经网络。再用迁移学习后的卷积神经网络提取Corel、Caltech-256数据集的图像特征,获得对应数据集的图像特征库。其次,使用PCA对经迁移学习后的卷积神经网络提取的图像特征库中的特征做降维,降维至64、96、128、256维,获得Corel、Caltech-256数据集上对应维度的图像特征库。然后,在做图像检索时,用迁移学习后的卷积神经网络提取待检索图像的语义特征,再对其进行降维。最后,把待检索图片的特征与对应维度的特征库中的特征做相似性对比并返回对比结果,返回的结果是逆序排列,本文使用的相似性度量算法是欧氏距离。实验结果表明,迁移学习后的卷积神经网络能够对图像特征进行有效的分离和表达,经过迁移学习后的卷积神经网络能够学习到图像的高级语义特征,检索精度对比于传统的基于内容的图像检索方法至少提升%3。特征降维后,在降低模型的运算量的同时提高检索效率,也消除了特征中不合理的或者冗余的噪声,从而使得图像检索的精度相对于降维之前有所提高。