论文部分内容阅读
基于内容的多媒体信息检索是目前活跃的研究领域,而持续增长的多媒体数据和媒体内容的多样性给多媒体检索带来了难题——如何组织多媒体数据,以及设计相应的搜索方法使得检索快速和高效,是基于内容的多媒体检索的技术难点。本文针对上述问题,对多媒体信息检索中的数据组织及搜索方法进行了深入研究,改进并实现了一种高效的数据组织方法,并提出一种快速的搜索方法,应用于本文设计的多媒体检索系统中。本文主要完成了以下工作。1、分析了基于内容的多媒体检索发展现状。对多媒体检索研究取得的成果进行了综述,指出了目前仍然存在的问题是针对高维空间的索引结构和算法的设计不够成熟,并且还没有建立起低层特征与高层语义的联系。2、通过对空间访问方法(Spatial Access Methods,SAM)和度量访问方法(Metric Access Method,MAM)两大类数据库索引方法的分析和比较,指出对于持续增长的多媒体数据适合采用动态的MAM索引方法。另外,通过分析多媒体检索系统的检索方法和查询方式,指出近似k最近邻居查询为适合以MAM方法组织的数据库的查询方式。3、重点分析并实现了HCT树(一种动态的MAM索引方法)的结构和操作算法,设计了细胞内删除元素的算法、层管理细胞分裂的算法、更新层的算法和累进检索算法。另外,通过对细胞紧密度的计算和细胞分裂的探讨,引入了跨度因子改进细胞紧密度的计算方法,并提出了用成熟细胞数量阈值来控制细胞分裂的策略。4、设计并实现了基于HCT树的多媒体检索系统,利用该系统对HCT树作了详细的数据组织性能测试和搜索性能测试,并对累进检索方法和遍历检索方法进行了比较。多媒体数据组织和搜索方法是基于内容的多媒体检索系统迈向实用的关键。本文的研究工作表明HCT树和累进检索方法能适用于持续增长的大型多媒体数据库,另外,本文设计实现的基于HCT树的多媒体检索系统提供了一个研究的平台,使得研究人员能集中精力研究特征提取和比较算法,将其集成到系统中进行测试,提高研究效率。