论文部分内容阅读
大规模检索问题早在本世纪初就已引起图像处理领域的广泛关注,但限于匹配算法效率不足和图像集规模的不断扩大,现有的检索方法在速度和存储方面仍无法满足用户对大规模检索的需求。本文正是基于大规模图像目标检索中常遇到的索引速度和存储代价问题,重点研究改善相应的关键技术,使大规模图像目标检索系统得到更好的用户体验。本文的工作主要是对以下几个内容展开研究:1.基于RSOM(Recursive SOM)积的特征量化编码针对海量样本的存储代价和量化精度问题,提出一种改进的RSOM[1]算法(RSOM积),该方法可以有效地解决高维量化和存储问题。算法通过对SIFT描述向量的均匀分割和分积量化,大大改善样本匹配过程的效率。不难发现,对高维向量进行均匀分割并以其子向量去匹配,由于维数成倍数的缩减会大大加快匹配的效率,同时也会加快图像索引的速度。再者,对高维特征的量化编码在一定程度上也是对存储空间的有效压缩。它可以用有限个数的聚类中心值去近似表示所有的训练样本,并将误差控制在允许范围之内。实验表明,量化误差将会随着量化中心个数的增加而相应减小。如当构建的16维RSOM聚类树叶子节点[1]数达到60000附近时,样本间的量化误差将会小于千分之五。2.具有相似性传播功能的图像搜索实现为避免特征检测和区域匹配等过程中出现的意外情况对图像检索结果造成的影响,本文将利用相似性传播原理实现图像之间的信息共享。如一个目标物体在一幅图中出现时比较模糊,那么我们在构造描述子时就能借助另外一张图像对其实现较好描述。该算法主要通过RSOM积算法对待训样本进行分割、量化、编码以及重构的过程,并最终依据图像两阶段的RANSAN[2]精度匹配以及倒排索引系统[5]完成对特定图像在大规模图像数据库中的检索。经测试,在包含5万张图像的数据库中,该算法的识别正确率达到95%以上且识别时间小于15毫秒。3.构建大规模图像检索系统为检验本文算法的可行性,本文基于RSOM积算法实现百万级图像的原型检索系统搭建。其主要包括数据库训练和图像检索两个模块。数据库搭建模块可以对大量样本进行学习,同时记录各个图像样本的特征数据以及样本间的相似性度量值。图像检索模块可以对任意图片进行精度搜索和广度搜索。用户可以依据特定检索需要获得合适的检索结果。同时,该系统还具有增量训练[3]以及相似性传播[4]的功能,在人机交互方面具有良好的表现。该系统目前已在长沙某科技公司试运行,在公司员工的人脸识别的应用中取得良好效果。