论文部分内容阅读
具有照相功能的手机、数字计算机的快速增加和社交网络的迅速发展,使得数字图像的数量以指数级增加.因此,处理海量图像的相关技术成为当前的研究热点.其中,大规模目标分类和目标检索技术是两个重要研究方向.研究者将词包模型(Bag of Words,BOW)的思想引入图像领域,提出了视觉词包模型(Bag of Visual Words,BOVW).视觉词包模型分为视觉词典生成阶段和局部特征量化阶段两个阶段.视觉词典生成阶段是从图像局部特征库训练得到一部分局部特征作为词典中词汇.对于基于内容的目标分类和检索,基于聚类的方法生成的词典更有代表性和区分性.因此,局部特征量化阶段使用的量化方法直接决定着BOVW模型的分类和检索性能.另外,对于高维BOVW特征,如何有效的存储和匹配对大规模图像检索技术提出巨大的挑战.基于上面的问题和挑战,本文的主要工作如下:一是研究了视觉词包模型中不同的量化方法,实验结果表明基于半径量化的视觉词包特征性能低于K-近邻量化直方图特征的性能,基于此本文提出了局部特征利用率,从理论上解释了实验结果的合理性。二是利用BOVW特征的稀疏性和倒排索引查询的有效性,我们提出了一种新的压缩视觉词包特征(Compressed Bag of Visual Words,CBOVW).CBOVW有效的降低了特征维数,进而减少了匹配过程的计算复杂度.三是利用基于哈希的方法对大规模目标检索的有效性,我们用谱哈希(Spectral Hashing,SH)技术加速CBOVW匹配过程,提出了一种新的算法快速压缩视觉词包特征(Fast Compressed Bag of Visual Words,FCBOVW).实验部分采用了目标图像库:PASCAL VOC 2006、University of Kentucky Recognition Benchmark,分别检验了RBBOVW的分类性能和算法CBOVW、FCBOVW的检索性能.算法CBOVW、FCBOVW的检索速度有明显优势,采用更有效的特征向量计算方法可以进一步提高FCBOVW算法的检索准确率.