论文部分内容阅读
随着互联网与多媒体技术的迅猛发展,数据信息也飞速增长,这使得图像检索技术倍受关注。基于内容的图像检索直接利用图像的视觉特征进行检索,能有效地提高检索的速度和效率,为图像检索的应用提供了更为广阔的前景。而高维数据索引结构、检索结果的组织及浏览模式作为图像检索中的重要技术,更是成为了基于内容的图像检索领域中的研究热点。高维索引机制是大规模图像库检索达到实时性要求的关键技术,能够有效地提高相似性检索的查询性能。虽然已经提出了很多高维数据索引结构,但是大部分索引结构在数据维数较高时,性能会急剧下降。针对高维数据索引结构的研究现状,本文在对高维索引结构进行深入研究的基础上,运用主成分分析中第一主成分方差最大的统计特性,提出一种基于主成分的索引结构:P2-tree。算法首先对数据集进行主成分分析,然后通过逐步聚类来分割数据集并建立索引树;查询时,综合运用三角不等式性质及主成分来过滤数据空间。从理论及实验上证明了该算法可以有效地减少距离计算的次数,具有较好的相似性查询性能,在一定程度上克服了维数危机。目前的图像搜索引擎大多运用基于文本的检索方式,检索返回的结果,采用的是基于排序的浏览方式。由于这种浏览方式忽略了图像本身的视觉特征,使得检索返回的图像集虽然丰富却很杂乱,不便于用户进行浏览和筛选。针对目前图像搜索引擎的浏览方式存在的不足,本文结合信息可视化技术,提出一种基于近邻可视的图像浏览算法,该算法综合了图像的语义及视觉特征,将搜索返回的图像集,依据图像的视觉特征相似度进行组织。此外,为降低计算时间,提高相似性搜索的性能,提出一种基于关键维的近邻搜索算法。实验显示文中提出的图像浏览方式,不仅能从一定程度上克服语义鸿沟的问题,也能加强系统与用户之间的互动,方便用户更高效更自然的对检索结果进行浏览。