论文部分内容阅读
高斯混合(GMs)函数表示图象内容是一种流行的方法,它比直方图方法能够更有效地描述图象内容,基于GMs的距离度量算法的研究已经成为基于内容图象检索的研究热点。本文主要研究基于GMs模型的两种距离度量算法,一种是最优化方法,其代表算法是旅行商距离(EMD),另一种是统计方法,其代表算法是渐进似然估计(ALA)距离,并且分别对它们提出了相应的改进算法。本文的主要内容如下:(1)Yossi Rubner提出了基于直方图及EMD的图象检索算法,由于直方图不能很好地描述图象的内容。本文在他的基础上提出使用高斯混合的期望最大(GMEM)算法进行图象描述,为EMD算法提供更恰当的概率模型。实验结果表明这种GMEM聚类加上EMD距离度量的方法可以有效地提高检索效率。(2)统计方法在图象检索中具有检索精度高的优点,但其代价是计算量很大。为克服该缺点,Nuno Vasconcelos提出了ALA算法有效地减少了计算复杂度。然而这种距离度量方式会使高斯混合模型方差较大的数据库图象产生误判。为此,本文提出了改进的ALA算法,即IALA,即利用分层的方法来提高检索精度。(3)例图混合成分的集中时,用IALA算法效果较好;反之,用EMD可以收到好的效果,这两种算法是互补的。本文进一步提出了测度选择(MeasurementSelect(MS))算法,即根据例子的特征来选择最好的距离度量算法。(4)原始的EM算法的无法跳出局部最优。本文提出了改进的EM算法并将它应用于基于内容的图象检索中。本文的IEM算法在迭代开始时用小方差;迭代过程中采用分裂操作,及删除操作来得到有意义的混合成分来使得EM算法跳出局部最优。