论文部分内容阅读
图像直方图由于其计算代价较小,且具有图像平移、旋转、缩放不变性等众多优点,广泛应用于图像处理的各个领域,特别是灰度图像的阂值分割、基于颜色的图像检索以及图像分类。图像分割是图像识别的基础,对图像进行图像分割,将目标区域从背景区域中分离出,可以避免图像识别时在图像上进行盲目的搜索,大大提高图像识别的识别效率以及识别准确率。基于灰度直方图的阈值分割计算简单,适合于目标与背景分布于不同灰度范围的灰度图像,特别是遥感图像。图像检索是指快速有效地从大规模图像数据库中检索出所需的图像,是目前一个非常重要又富有挑战性的研究课题。颜色特征由于其直观性、计算代价较小等优点,在图像检索中扮演着重要的角色,早期的图像检索算法也主要利用颜色特征,特别是颜色直方图。图像分类任务主要是指对一组图像进行一系列自动处理,最终确定图像所属的类别。图像分类具有广泛的应用前景,是计算机视觉的热点难点问题。针对图像分类的算法众多,其中以基于bag-of-words模型的方法最为经典有效。该方法首先利用提取的颜色、形状等特征构建视觉词典,然后在图像上统计视觉词的直方图,最后利用视觉词直方图作为特征运用分类器(例如非线性的SVM分类器)进行分类决策。对于应用于图像分割的灰度直方图,现有的灰度直方图形状容易受到噪声干扰,构建在其上的分割算法鲁棒性不足,迫切需要研究一种能消除噪声干扰且适应能力强的灰度直方图图像分割方法;对于应用于图像检索的颜色直方图,传统颜色直方图描述方法存在特征维数高、受光照影响、不能表达相近颜色间相关性及丢失空间位置信息的问题。因此,需要研究综合考虑多种因素的颜色直方图方法;对于应用与图像分类的基于bag-of-words模型构建的构建视觉词直方图,现有的基于bag-of-words的方法在视觉词的构造、直方图的统计上仍存在不足之处,使得最终得到的视觉词直方图不能很好地表达图像类别特征,因此需要研究新的基于bag-of-words的算法解决这些问题。本文具体研究了灰度直方图、颜色直方图、视觉词直方图以及构建在这些直方图上的图像分割、图像检索、图像分类应用。主要研究工作如下:1.针对一维阈值分割算法适应性差、容易受噪声干扰,二维阈值分割算法计算复杂度高的问题,提出一种基于区域划分的灰度直方图综合阈值分割算法。该算法利用像素灰度以及邻域均值组成二维空间,在此二维空间上利用区域划分的方法来构造一维直方图,再综合最小误差、最大熵以及最大类间方差(Otsu)三种经典的分割算法,构造新的阈值选取方法,最后利用获取的阈值指导图像分割。实验结果表明,本文提出的算法对比经典的一维阈值分割算法具有更强的适应性,以及稳健的抗噪性;同时与二维Otsu算法相比,适应的噪声种类更多,算法的计算复杂度小很多。2.传统的颜色距离度量通常采用最简单的欧式距离度量方式,但在HSV颜色空间上,由于各分量对颜色的贡献程度不同(H分量对颜色贡献度最大,S分量其次,V分量最小),因此这种简单的颜色距离度量方式不能很好地移植到此空间上。针对这一问题,本文提出参数化的HSV颜色空间距离,通过参数的差别来区别不同分量。然后人工标注颜色对间的距离的相对大小,并利用基于pair-wise的学习方法训练已标注的数据,最终学习出距离公式中的各参数,得到适合HSV空间的参数化的颜色空间距离公式。3.针对传统颜色直方图存在计算维数高、易受亮度变化影响、相近颜色缺少相关性以及丢失空间位置信息四个问题,提出一种基于聚类的空间颜色直方图方法。该方法首先对图像进行k-均值聚类,然后在聚类图上统计考虑空间位置分布的空间颜色直方图。同时,通过人工标注数据方法训练出HSV颜色空间的参数化距离公式,并在此之上给出空间颜色直方图的相似度匹配算法。实验表明,该方法实现简单,较好地反映了图像颜色特征,基于本文算法的图像检索效果比传统方法有所提高。另外,该方法适应性强,可根据需要标注相应的数据进行训练,从而满足多样性的主观颜色相似需求。4. bag-of-words是图像分类的经典方法,其核心问题是视觉词如何选择以及如何统计视觉词直方图。本文提出一种基于视觉词直方图的图像分类算法。该方法首先利用视觉注意机制应用在分类图像上,得到图像的显著度图。然后提取颜色、形状等多种图像特征,利用显著度图构造权值,生成词典,统计每个图像的视觉词直方图,再利用L1正则化的逻辑回归方法筛选特征,最后将筛选后的特征利用SVM分类器进行分类决策,最终得到图像分类结果。针对多组图像库的对比实验表明,本文方法具有较强的适应性,分类结果准确率高。