干扰图像快速检索算法

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:blzzb001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文章提出了一種适用于大规模数据集的图像检索算法,目的是在有干扰的情况下,准确地找出目标图片。本文采用局部特征算子作为衡量标准,又创造性地在每个视觉词袋后[1]建立图像索引,形成以特征算子为基元的带权视觉词典结构,在保证检索精度的前提下尽可能的提高检索速度,更好的满足了大规模数据对效率的要求。实验证明,该算法具对存在一定干扰的图像效果显著,鲁棒性强,达到了国际一流水准。
  关键词:图像检索;局部特征算子;带权视觉词典;干扰图像
  中图分类号:TP391.41 文献标识码:A文章编号:1007-9599 (2011) 20-0000-01
  Interference Image Quick Search Algorithm
  Yin Changqing,Mao Wei
  (School of Software Engineering,Tongji University,Shanghai200092,China)
  Abstract:This paper presents a large-scale data sets for image retrieval algorithm,the aim is the case of interference,and accurately identify the target picture.In this paper,the local operator as a measure of standard features,but the visual creativity of each word in the bag[1]to establish an image index,to form a characteristic element of the operator-based visual dictionary with the right structure to ensure the accuracy of the premise to make retrieval possible to improve the retrieval speed,and better meet the requirements of large-scale data on the efficiency.Experiments show that the algorithm with the image of the interference effect of certain significant,robust,reaching a world-class standards.
  Keywords:Image retrieval;Local feature operator;Dictionary with the right visual;Interference image
  一、引言
  图像检索指的是根据用户提交的查询条件,在图像数据库中搜索并找出相符合的图片或图片集。根据目的不同,可以分为精确匹配检索和模糊相似检索;根据衡量标准不同,又可以分为立足于文本,立足于图像内容以及文本和内容相结合三种形式。其中基于内容的检索方式在近几年来发展迅速,是图像检索中一个十分热门的研究方向。本文中要讨论的正是基于内容的图像精确匹配检索算法。
  二、本文算法
  在选择特征描述符之前,我们首先使用FAST-9算法得到图像的关键点,之后部分采用SIFT方法得到特征描述符。这样每个关键点就可以产生一个128维的特征向量。由于图像特征描述符的数量庞大,直接建立索引的开销不菲,特别是针对大规模图像,可行性低。所以我们提出了一种带权的视觉词典模型,对所有图像的特征描述符进行聚类,得到一定数量的视觉单词。每个视觉单词由2部分组成,前一部分是128维的特征描述符,后一部分是由一系列图像序号组成的索引列表。考虑到检索效率,下一步用这些视觉单词的key部分建立kd-tree。我们就把这样一个由一棵128维的key搜索树和叶子节点所对应的value值所组成的数据结构称为带权视觉词典。
  在得到目标图像之后,我们首先提取图像的关键点生成相应的特征描述符。再把这些特征描述符分别带入视觉词典进行检索,找到相对应的key值(基于kd-tree的近似最近邻搜索[2]),同时也就得到了这个key值所对应的value向量。之后把所有的关键点采集到的value值进行加权,即可以得到图像权重列表,并且很容易的就可以从中找出Wmax。按照上述模型,目标图像I总能找到一张和他最接近临时检索结果I’。假设目标图像有T个特征点,图像库的大小为M,临时检索结果的权重为Wmax,这里我们需要引入一个百分比阈值Per,如果 ,那我们就认为这个Wmax对应的I’为最后的检索结果;否则目标图像不存在于图库中。
  三、实验结果和分析
  本文选取Corel图像库进行测试。把所有的9907张图像全部作为样本进行训练,建立相应的带权视觉词典。之后取出有不同关键点数量的80张图片作为目标图片,和传统的视觉词袋法[1]进行对比测试。本文算法的平均耗时在600ms左右,而传统的视觉词袋算法则需要大约2s的时间,而且算法的平均耗时随着关键点数目的增多有着显著的上升趋势。显然,在图像数量庞大的情况下,传统的时间词袋方法已经很难达到实际应用的需求。
  我们再次从图像库中随机选出200张图片,把他们均匀分为4类。对其中3类进行边缘切割、旋转变换和加上干扰像素。把处理过的图片作为目标图片进行检索,测试系统应对各种不同干扰的能力。这里比较了本文算法和传统基于全局特征的算法。对于没有任何干扰的图像,它们都有很高的正确率。但是在切割干扰和像素值干扰测试上,基于颜色特征算法和基于纹理特征算法的正确率都有了明显的下降,其中当图像存在像素干扰时,基于颜色算法的正确率甚至不足10%。从实验中不难发现,本文算法的正确率虽然也有小幅下降,但是它的抗干扰能力明显强于其他两种算法。
  eBay每天都会新增成千上万的商品,有些图像是禁止用户上传的。这里我们有一个黑名单图像库,共计有11579张图片,以它为样本建立视觉词典。此外还有一个记录2011年第一季度eBay美国站点新上传图片的图像库(314293张),我们称它为待测图库。现在的任务是在待测图库中找出那些违规图片。可以想象,在实际上传图片的过程中,卖家很可能会对商品打上自己的水印,或者是对图片进行一定的处理,这样会造成图像的干扰很大。实验结果表明,基于颜色特征的算法找出的违规图片数量最少;基于纹理特征找出的图片数量要高于基于颜色特征的算法;而通过本文算法找到的违规图片最多,数量上要远远高于前两者。显而易见本文算法在查全率上要更胜一筹。
  四、结论
  本文的算法以关键点为基元,建立带权数据词典,通过所得权重大小来检索图像,打破了常规检索算法以图像为基元建立直方图的检索模式。实验结果表明,本算法在检索速度上要明显优于传统的视觉词袋法,同时在应对目标图像干扰时,本算法表现出很好的抗噪能力,鲁棒性强。
  参考文献:
  [1]G.Csurka,C.Bray,C.Dance,and L.Fan.Visual categorization with bags of keypoints[C].In Proc of ECCV Workshop on Statistical Learning in Computer Vision,Prague,Czech Republic,2004.
  [2]Muja M,Lowe D.Fast approximate nearest neighbours with automatic algorithm configuration[C].4th International Conference on Computer Vision Theory and Applications.France,Springer Verlag,2009,331-340.
其他文献
我国自2016年出台《关于在市场体系建设中建立公平竞争审查制度的意见》后不断在实践中探索完善公平竞争审查制度及其监督与追责机制。我国目前在监督制度上,还存在反垄断委员会、国家市场监管总局、部际联席会议三家机构监督分工不明确、监督审查范围未将效力较低的地方政府规章与行政规范性文件包含在内的局限性、社会监督在对审查文件公开和运作程序上的规定不合理及新生的第三方评估制度尚不健全等问题;在责任追究上,现有
通过对农村土地使用权流转的内在形成机理与外在形成机理的分析,探讨了农村土地流转的内因和外因。
本文研究如何应用FDTD方法对一些复杂波导元件进行分析。应用子域连接技术,配合PML技术、连接边界法和非正交网格技术等,以波导双T、混合接头环耦合器等波导元件为例,得出这些器件的散射
低空风切变因其突发性强、尺度小、生命期短和破坏性极强等特征对飞行安全造成严重威胁,尤其是在飞机起飞以及降落阶段,激光测风雷达可以提供更加精细的三维风场信息,弥补了常规探空测风的时空密度不足,是低空风切变监测预警的有效探测设备,因此对激光雷达下低空风切变风场特征分析以及识别算法的研究是急迫和重要的工作。利用2018年46月、2017年12月2018年6月和2018年18月在我国攀枝花保安营机场、西宁
本文给出一种用改进的Bulter移相网络实现面天线阵的方法。这是一种固定多波束天线系统。且线由四个全向天线组成,天线阵的方向性可通过发迹馈电端口来控制,提供3606度全方向覆盖,方向解析
【摘 要】有效性课堂是现在教育时间的永恒话题,新课程、新课标,都对我们现在的教学课堂提出全新的要求。初中化学课程与其他学科不一样,它的实践性和趣味性比较强,欠发达地区乡镇初中的学生的学习群体学习情绪不高涨,因此教师在化学课堂教学的时候应该关注学生的学习兴趣,提高学生学习的主动性及积极性,进而促进学生化学成绩的提高。  【关键词】欠发达地区;初中化学;有效课堂  【中图分类号】G633.8
本文基于B-样条插值提出了一种分析高速互连线瞬态响应的新的数值模型.算例分析表明,本文提出的新模型具有很高的计算精度和计算效率.
从稳定面积、提高单产、扩大营销、促进增收即“稳基地、提单产、扩营销、促增收”4个方面探讨和总结出了适合西吉县马铃薯产业持续健康发展的具体思路和可行途径,具有一定的
肝豆状核变性(HLD)又称Wilson病,是一种常染色体隐性遗传病.由于其临床首发症状表现复杂多样,缺乏特异性,误诊率在50%以上[1],个别病例误诊时间长达10年以上.笔者发现曾在两个
利用瓜参肉重0.75%的胃蛋白酶在50℃下处理4h,添加8%的β-环糊精,以进口温度180℃喷雾干燥制成蛋白粉,最终羟脯氨酸含量为73.17mg/g。有效解决了瓜参加工过程中外皮难以软化