论文部分内容阅读
基于内容的图像检索技术是指利用图像内容对图像进行查询。图像的内容包括图像的颜色特征、形状特征、纹理特征、语义特征等。 图像特征提取技术和相似性度量技术都属于基于内容的图像检索技术的核心问题。本文主要针对这两个问题,研究如何描述图像内容,准确、自动地提取特征,以及精确地对图像内容进行相似性度量。 本文首先在已有颜色直方图的基础上,研究如何抽取基于图像特征的颜色标识。根据图像颜色分布的复杂性和区域性,得到图像颜色复杂性的指数,利用这个指数确定量化图像的颜色数目,生成具有个体特色的特征。 其次针对图像检索数据量庞大的特点,按照由简单到复杂的层次检索的思想,提出了对图像进行完全自动的粗分类算法。把自然彩色图像首先粗略地划分成纹理图像和非纹理图像。该方法利用图像的“内容”计算出一个统计量,通过统计量与门限的比较把图像先分成两大类,针对每一类的具体特点进行不同的处理。 对纹理图像的特征提取,利用纹理图像均匀分布的特点,建立图像的颜色描述子。同时利用Gabor小波变换提取图像的形状分布特征,得到图像的能量分布描述子。基于内容的纹理图像检索系统建立了基于图像颜色和形状的检索,根据查询的不同要求,利用不同的特征进行相似性度量,得到不同的检索结果。 针对非纹理图像的分布特点,把图像检索分成基于全局和局部的检索。对基于局部的检索,估计查询模板在数据库图像中存在的尺度,判断模板在图像中是否存在,得到检索结果。对基于全局的图像检索,建立的图像特征包括:颜色描述子,图像ROB的三色平均值和分布中心值,以及利用傅氏极坐标变换得到的能量分布描述子。进行检索时,利用上述特征采用分层检索的方法,得到最终的检索结果。 在进行特征的相似性度量时,本文分析了一一映射距离和交叉映射距离的不足,提出了基于人类识别比较特点的最优权值度量距离,利用运输问题的计算方法对该距离的实现找到了理论依据。实验证明,用该距离进行图像的相似性检索与人类视觉检索的结果一致。 论文最后总结了本文的工作,并提出进一步的研究探索方向。