论文部分内容阅读
相关反馈方法和高维数据的索引机制是面向大规模图像库基于内容检索的两个重要问题。相关反馈方法是弥合图像检索中高层语义和低层特征之间语义间隔的一个重要途径,而有效的高维索引机制则是面向大规模图像库的检索能够达到实时性要求的关键技术。对数据分布的精确描述及对数据空间的有效划分是高维索引机制中的关键问题。论文提出了基于矢量量化的精确索引机制。该方法使用更适合真实图像库的高斯混合模型描述数据分布,并训练优化的矢量量化器划分数据空间。和现有的精确索引机制相比,可以显著减少检索时需要访问数据向量的次数。在矢量量化索引机制的基础上,论文提出了基于分层结构的近似索引机制。该方法在矢量量化索引机制的基础上使用了概率近似最近邻的方式进行检索,这种两种索引机制相结合的方法取得了比单独的索引机制更好的性能。相关反馈方法研究中的一个关键问题是如何从数目很少并具有不对称性的反馈样本中抽取出最适合表达用户查询概念的特征。论文提出了基于特征子空间分析的相关反馈方法。该方法同时利用图像特征向量在特征子空间内的距离和到特征子空间的距离,并使用两阶段判别式分析的方法求解出适合形成图像检索决策准则的特征。该方法所使用的特征判别既能较好的处理正负样本的不对称性,又能更充分的反映用户的查询概念。针对线性方法对真实图像库中样本分布描述能力的不足,论文研究了基于非线性特征抽取的相关反馈方法。通过对二次型距离的推广,提出了二分量判别函数,使用非线性的方法抽取反映散度判据和距离判据的特征,具有比线性方法具有更高的检索精度。核函数方法是解决非线性问题的通用方法。针对现有基于核函数的相关反馈方法处理样本不对称性时的缺陷,提出了基于超球面的支持向量分类方法。该方法能够同时利用正负反馈样本构造分类器,并能更好的适应两类样本的不对称性,进一步提高检索精度。