面向大规模图像库的层次化索引机制研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:shiyigudan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合理的高维索引机制是提高大规模图像库基于内容检索性能的关键,然而,由于受到“维度灾难”的影响,传统的索引结构在处理高维数据时,性能急剧下降。针对上述问题,本文以大规模图像库的基于内容检索为应用背景,围绕图像特征的“高维”特性,以高维空间的子空间为出发点,研究了图像高维特征数据的索引问题。在相关研究的基础上,论文首先明确了高维数据索引所要解决的主要问题,提出了高维索引的研究框架,然后针对该框架中的相似性度量、聚类和降维分别进行了研究,并最终提出了一个可适用于大规模图像库基于内容检索的高维索引机制。论文的贡献主要体现在以下几个方面:提出了一种基于子空间的高维数据相似性度量方法。传统的度量方式都在数据集的整个特征空间中计算数据之间的相似性。在高维情况下,如果仍然采用这些度量方法,数据特征中的噪声维将对度量的结果产生显著的影响,从而导致度量结果的不准确性。针对该问题,本文提出了一种基于子空间的相似性度量方法,该方法在高维特征空间的一些子空间中度量数据之间的相似性,从而能够克服高维数据中的噪声属性对度量的影响,以获得更准确的相似性度量结果。提出了一种基于密度的子空间聚类方法。在高维空间中,由于数据的稀疏性,传统的聚类方法难以有效地聚类高维数据。针对该问题,本文提出了“维度最大化子空间聚类”的概念,并在此基础上提出了一种基于密度的子空间聚类方法。该方法将子空间聚类的思想与基于密度的聚类思想有机结合起来,充分利用了基于密度的聚类方法能发现任意形状聚类的优点,同时也有效克服了“维度灾难”的影响,算法在聚类的规模与聚类所在的子空间的维数之间进行了合理的折衷,从而使得聚类的结果能够为高维数据索引的建立提供更加完整、准确的依据。提出了基于子空间聚类的高维数据索引结构以及对应的相似搜索算法。基于密度的子空间聚类方法能够形成任意形状的不规则聚类,而传统的基于中心点的聚类表示方法往往无法有效地表示这些聚类。针对该问题,本文基于代表点的思想,采用多个代表点来表示一个聚类,并给出了聚类代表点的选择方法,从而建立了基于子空间聚类的索引结构;在基于该索引结构的相似搜索中,针对样本对象与子空间聚类的匹配问题,提出了样本对象与子空间聚类的匹配方法,该方法通过一个校正因子很好地解决了聚类存在于不同子空间的问题,从而有效地克服了聚类所在的子空间的维数对匹配过程产生的影响,提高了相似检索的合理性。提出了一种基于个体本征维的降维索引机制。传统的降维方法大多从数据集的整体特性出发,把数据集中所有的数据点都降维至一个统一的子空间中,将它们直接用于高维数据的索引将会由于过高的信息损失而影响相似搜索的性能。针对该问题,本文提出了基于个体本征维的降维思想,并针对图像的72维HSV颜色特征,提出了一种基于个体本征维的降维索引方法。相对于子空间聚类而言,该方法从减少相似搜索计算量的角度出发,很好地解决了高维数据的索引问题。综上所述,本文主要针对图像特征数据的高维特性,研究了基于内容图像检索中的高维索引问题。由于“维度灾难”的影响,很难在整个特征空间中来度量高维数据的相似性并据此建立高维数据的索引结构。以此为出发点,本文从子空间的角度分别研究了高维数据的相似性度量和聚类,并从个体本征维的角度研究了高维数据的降维问题。这些研究为克服“维度灾难”的影响提供了有效的手段,并为面向大规模图像库的高维索引机制的建立提供了可行的解决方案,对于相关的研究具有重要的理论及实践上的参考价值。
其他文献
马铃薯蛋白为重要的马铃薯淀粉加工副产物。随着马铃薯蛋白提取纯化工艺的发展,马铃薯蛋白的理化特性和功能特性也逐渐被人们所了解。对马铃薯蛋白的水解工艺及蛋白和水解产
对于一个企业来说最重要的就是经济利益,而要有效的获得经济利益,就不可能离开有效地计算工作,因为正是有了严格的各种核算工作,才能够有效地保证企业的利润利益。但是实际上
近年来,乡村休闲旅游成为现代旅游业发展的重要组成部分,对促进农业增效、农民增收效果明显。本文以烟台市福山区为例,对该区乡村旅游发展情况进行了分析,对应提出了如何依托
迄今为止,光通信系统都是光源、光端机、光缆和大量电子器件的混合系统,即"光电系统"或"半光系统"。在这类系统中,信息光转换为电信号,然后通过转换器将电信号转换为光信号,
目的深入探讨2型糖尿病合并脑梗塞患者的临床特征与治疗效果。方法将该院在2013年12月—2015年6月期间内进行诊治的34例2型糖尿病合并脑梗塞患者确定为该文分析的实验组,同时
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:调查社区居民防治肿瘤的知识水平,评价肿瘤健康教育的效果。方法:随机抽样2个社区300名居民为研究对象。一个社区150名作为试验组接受健康教育,另一个社区150名作为对照组未
<正> 澳大利亚关保林公司已经成功地研制出一种光纤秤,它只用一根光纤和一个激光嚣就可以给卡车称重。目前,该公司正
今年1月美国新总统布什入主白宫,1月下旬以来,美俄两国围绕美国部署国家导弹防御系统(NMD)问题的争论明显升温.1月14日,美国新任国防部长拉姆斯菲尔德宣称,1972年美苏两国签
建立良好的家校关系、提高家校沟通的有效性,能更好地促进教育工作的开展。云录播系统是针对学校教育开发的,集课堂实录、录制微课、班级交流群、作业公告、各科练习题等功能