论文部分内容阅读
随着互联网的飞快发展和移动设备的更新换代,大量的图片数据和生活变得紧密相连。如何准确高效的在海量图片中进行查找,一直是图像检索领域的重点和难点。早期,图像检索主要通过人工手段为图像添加标签,基于文本实现图像的匹配。随着图像数量的激增,人力成本增加以及匹配精度的下降,导致基于文本的图像检索无法满足需求。20世纪90年代,图像的视觉信息可以被提取出来,研究者们利用图像的视觉特征在图像检索中达到了更好的效果,基于内容的图像检索技术逐渐占据了主流的地位。但视觉信息属于图像的底层特征,无法理解图像的语义信息,仍有较多的不足之处。近几年来,深度学习技术得到了飞快的发展,尤其是卷积神经网络,可以提取图像的高层语义特征,在图像检索领域展现了优于传统方法的性能。不过无论是底层特征还是高层语义特征,单一特征的表述力都不够全面,而利用多特征进行融合,通过互补特征从不同的角度描述图像内容,可以克服这一问题。因此本文提出了一种结合多特征进行图像检索的方法,以提高图像检索的准确率。本文主要研究内容如下:(1)针对单一特征对图片内容表达不充分的问题,本文提出了结合卷积神经网络特征和SIFT特征的融合特征,选择基于VGG16提取出的RMAC特征作为高层语义特征,选择基于SIFT描述子的VLAD特征作为底层特征。融合特征既包含图像的底层信息,又包含图像的高层语义信息,可以更加全面的表述图像的内容。通过归一化和PCA白化对两种特征进行处理,同时设计了特征层融合和得分层融合两种方案,通过实验确定融合方案中的权重。最后在Holidays、Oxfords5k和Paris6k三个数据集上验证融合特征的效果,实验表明融合特征与单一特征相比较,可以达到更好的效果,证明两种特征具有互补性。其中得分层融合方案提升更明显,对于这两种特征,得分层融合比特征层融合更加合适有效。(2)为了充分发挥特征的作用,提出一种基于距离得分变化率的自适应加权多特征融合的方法。同一特征对不同图像的效果不同,特征融合时不同的图像特征所占据权重的大小也应该是变化的。基于得分层融合方案,根据欧式距离计算图像间的得分,分析查询图片在某一特征下邻域空间内得分的分布性质,得到图片在某一特征下邻域空间的距离得分变化率,从而确定权值的大小。实验表明,与固定权值方法对比,基于距离得分变化率的加权方法可以达到更好的效果,充分发挥了不同特征的作用。