论文部分内容阅读
进入21世纪以来,随着互联网的普及工作不断深入,推动了多媒体技术的快速发展,因而产生了海量的图像视频数据,图像数据已经成为互联网数据的重要部分。如何快速地在种类繁多数量庞大的图像数据库中检索到有用的信息是一个亟待解决的问题。现如今,网络上的图像数据量不断上升,且数据维度越来越大,传统的基于树索引的图像检索方法已然不能满足要求。基于哈希算法的图像检索方法由于其计算速度快,存储量低,检索性能较好等特点受到了国内外研究者们的关注。本论文的主要研究内容是基于哈希算法的图像检索方法。图像哈希具有较好的数据降维能力,因而对于大型的图像数据库而言,能够有效而又快速的检索出有用的信息。针对基于哈希算法的图像检索,本论文首先对已有的哈希算法进行介绍和综合分析,然后进行改进,并应用到图像检索中。首先,针对一些哈希算法在数据处理时,平等地对待投影数据的每一个维度,忽略了数据各个维度之间的信息,从而不能较好地保留数据之间的相似性问题。结合自适应二进制量化(Adaptive Binary Quantization,ABQ)方法,研究了一种基于ABQ算法的加权哈希算法(WABQ)。该算法在数据经过PCA降维后,计算降维后的数据各个维度的方差,形成一个权重矩阵,用以平衡原始数据在映射后各维数据的方差,以保证每一维的信息量大致相同。实验结果证明,该方法在一定程度上提升了均值平均精度(mAP)和查全率,而且与原有的算法相比,在数据集的训练时间上也有所改善。其次,由于在利用哈希算法进行图像检索时,对图像提取局部特征,很难建立图像检索索引,所以将改进的算法应用到图像检索时,对图像提取全局特征,每幅图片用一个全局特征表示。而且针对一些基于哈希算法的图像检索方法往往是将彩色图像灰度化以后,再对图像提取全局特征,从而忽略了彩色图像的颜色信息的现象。本论文提出了一种结合颜色特征和基于ABQ加权哈希的图像检索方法。该方法可以分别计算查询图像和图像数据库中的每幅图片的颜色距离和汉明距离,并且最后检索的距离是颜色距离和汉明距离的加权和。实验证明,该方法与WABQ方法相比,检索性能有所提升。最后,对本文工作进行总结,并根据所提出的方法的不足指出以后的研究方向。