基于RSOM积的大规模图像目标检索关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:w168730018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模检索问题早在本世纪初就已引起图像处理领域的广泛关注,但限于匹配算法效率不足和图像集规模的不断扩大,现有的检索方法在速度和存储方面仍无法满足用户对大规模检索的需求。本文正是基于大规模图像目标检索中常遇到的索引速度和存储代价问题,重点研究改善相应的关键技术,使大规模图像目标检索系统得到更好的用户体验。本文的工作主要是对以下几个内容展开研究:1.基于RSOM(Recursive SOM)积的特征量化编码针对海量样本的存储代价和量化精度问题,提出一种改进的RSOM[1]算法(RSOM积),该方法可以有效地解决高维量化和存储问题。算法通过对SIFT描述向量的均匀分割和分积量化,大大改善样本匹配过程的效率。不难发现,对高维向量进行均匀分割并以其子向量去匹配,由于维数成倍数的缩减会大大加快匹配的效率,同时也会加快图像索引的速度。再者,对高维特征的量化编码在一定程度上也是对存储空间的有效压缩。它可以用有限个数的聚类中心值去近似表示所有的训练样本,并将误差控制在允许范围之内。实验表明,量化误差将会随着量化中心个数的增加而相应减小。如当构建的16维RSOM聚类树叶子节点[1]数达到60000附近时,样本间的量化误差将会小于千分之五。2.具有相似性传播功能的图像搜索实现为避免特征检测和区域匹配等过程中出现的意外情况对图像检索结果造成的影响,本文将利用相似性传播原理实现图像之间的信息共享。如一个目标物体在一幅图中出现时比较模糊,那么我们在构造描述子时就能借助另外一张图像对其实现较好描述。该算法主要通过RSOM积算法对待训样本进行分割、量化、编码以及重构的过程,并最终依据图像两阶段的RANSAN[2]精度匹配以及倒排索引系统[5]完成对特定图像在大规模图像数据库中的检索。经测试,在包含5万张图像的数据库中,该算法的识别正确率达到95%以上且识别时间小于15毫秒。3.构建大规模图像检索系统为检验本文算法的可行性,本文基于RSOM积算法实现百万级图像的原型检索系统搭建。其主要包括数据库训练和图像检索两个模块。数据库搭建模块可以对大量样本进行学习,同时记录各个图像样本的特征数据以及样本间的相似性度量值。图像检索模块可以对任意图片进行精度搜索和广度搜索。用户可以依据特定检索需要获得合适的检索结果。同时,该系统还具有增量训练[3]以及相似性传播[4]的功能,在人机交互方面具有良好的表现。该系统目前已在长沙某科技公司试运行,在公司员工的人脸识别的应用中取得良好效果。
其他文献
犯罪工具痕迹是现场勘查中最常见的一种痕迹,不容易被破坏或伪装,出现率高而且特征稳定。但是,由于犯罪工具痕迹的种类和形态都非常复杂,又没有方便使用的技术和检验工具,致使犯罪
伴随着计算机和网络技术的高速发展,数据采集系统从传统电路、微机模式发展为嵌入式系统模式,嵌入式系统在现代工业数据采集中扮演着不可替代的重要角色。本文研究的主要内容
随着科技的飞速发展,对数字化信息处理的要求越来越高。但数字信息数据量大的特点也对信息存储设备及通信网络均提出了很高要求。为此,国际标准化组织和运动图像专家组等机构
随着信息技术和互联网的飞速发展,网络媒体已经成为一种主流的信息传输途径,越来越多的作品通过互联网来进行传播,这为我们提供极大便利的同时,也给我们提出了许多问题和挑战
随着社会的发展,人们对电力需求特别是电能质量的要求越来越高。但由于非线性负荷大量使用,却带来了严重的电力谐波污染,给电力系统安全、稳定、高效运行带来严重影响,给供用电设
随着卫星导航应用的逐步扩展,接收机的工作环境愈发复杂,对接收机的适应性能的要求进一步提高。对于军事应用而言,战场的环境复杂多变,尤其是丛林和巷战,导航信号衰减严重;对
第四代移动通信系统为了满足用户对高速率和高服务质量的要求,以及运营商对高容量和无缝传输的要求,采用了许多新的无线链路传输技术,包括OFDM技术、MIMO技术、高效信道纠错
煤矿安全事故频出,严重影响了正常的生产工作和人员的生命安全,因此更加显示出煤矿安全信息系统对于煤矿安全生产的重要性。 现今的煤矿安全信息系统都是以工业总线为基础,构