【摘 要】
:
传统的基于内容的图像检索系统返回给用户的是按照与查询图像相似性大小排序的目标图像序列,而目标图像之间的相似性在系统中被忽略掉,基于聚类的图像检索系统返回给用户的是
论文部分内容阅读
传统的基于内容的图像检索系统返回给用户的是按照与查询图像相似性大小排序的目标图像序列,而目标图像之间的相似性在系统中被忽略掉,基于聚类的图像检索系统返回给用户的是目标图像的聚类结果,从而将目标图像的相似性考虑在内。在基于内容的图像检索系统中,由于返回的图像是与查询图像在视觉特征上很相似的图像,它们在原始特征空间会呈窄带的形状。此外,用户标记的样本往往是不充足的,同时也是不对称的,即正例一般少于负例。在这些情况下,传统的基于SVM的学习算法由于样本的混杂性、不充足以及不对称性,其学习能力会受到很大的影响。同时,好的特征应该能够使相似的图像聚合而使不相似的图像分开。然而,固定的不同的组合特征在很多情况下的操作性能要比“某些”好的特征的性能差。例如在颜色和纹理特征的组合特征下,颜色排序得到的好的排序结果在纹理特征的影响下则可能会退化。本文根据图像的底层视觉特征对目标图像进行聚类,通过两层的图像显示结构改进用户和检索系统的交互方式。在聚类检索的基础上,针对用户反馈时标记的样本少,并结合样本分布的特点以及图像特征的表征能力,本文提出基于聚类的层次化SVM学习算法。将所有的类内的SVM集成在一起构成新的分类器,用于捕获用户的检索需求,减少“语义鸿沟”的影响,大大提高了检索系统的性能和效率。为解决图像低层特征的表征能力,本文提出基于熵的本征特征空间选择方法,同时本文提出内类的样本选择方法用以提高SVM的训练效率。通过与传统的SVM学习算法、主动采样的SVM学习算法以及bootstrap采样的SVM的学习算法的实验比较,表明本文提出的算法的检索性能得以提高。
其他文献
三维人脸重建是计算机视觉的核心研究内容之一,它涉及的内容包括三维人脸识别、三维人脸动画、3D游戏仿真、虚拟现实等方面的应用。随着一大批人脸重建算法的涌现,近年来,三维人
随着互联网的广泛应用,互联网上出现了大量的垃圾信息以及各种网络攻击。要想营造一个健康和安全的网络环境,一个重要的手段就是对互联网信息进行分析过滤。过滤垃圾信息和入侵
Linux具有功能强大、开放源码、支持多种硬件平台、模块化设计等优点,在嵌入式领域得到了广泛的应用。但同时Linux是一个分时操作系统,其不可抢占的内核、粗糙的时钟粒度、频繁
可分级视频编码(SVC)作为H.264/AVC的可分级扩展,是正在制订中的视频编码标准。它通过时域层、空域层和质量(SNR)层的混合可分级的机制,在比特流级上实现可分级性,同时具有很
网格使人们可以无缝的集成广域资源来合作解决问题。在网格环境里如何有效的管理资源和调度计算就成为影响网格计算是否成功的最重要因素之一。而资源发现和资源选择又是网格
Linux系统是一款优秀的开放源码的操作系统,正是因为其开放性和可移植性使它在当前的嵌入式产品开发中有着非常重要地位。通用串行总线(USB)作为一种新型总线,日益广泛地应用
Web服务(Web Services)已经成为分布式网络计算的发展趋势。然而现有的Web服务技术只关注对服务输入输出数据类型以及访问细节的说明。由于缺乏语义描述,无法支持服务的自动
工厂各车间选址、医院布局、电脑键盘分布设计、任务分配调度等都可归结为二次分配问题。在理论上,二次分配问题属于组合优化问题,存在“组合爆炸”现象。归因于NP-hard属性,很
手语识别研究的目的是增进聋人与听力健康人之间无障碍的交流,提高计算机对人体语言的理解能力。非特定人手语识别是推动手语识别系统实用化所必须解决的问题。目前,非特定人
语音识别是计算机技术的一个重要发展方向,是指机器通过学习来实现从语音信号到文字符号的理解过程,也就是让计算机听懂人的话,并做出正确的反应。语音识别作为一门交叉学科,与声