论文部分内容阅读
随着计算机技术、多媒体技术以及Internet技术的发展,人们越来越多的接触到大量的图像信息。如何有效、快速地从大规模图像数据库中检索出所需的图像已成为目前检索领域一个相当重要且具有挑战性的研究课题。基于内容的图像检索技术正是为了解决如何有效地从图像数据库中检索出相关图像的问题。近年来,此项技术已成为国内外广泛关注的焦点,并在许多领域都有了广泛地应用。本文主要围绕基于内容图像检索中图像特征提取这一关键技术展开研究,系统地探讨了图像低层视觉特征的提取技术,覆盖的内容主要包括图像的颜色特征、形状特征、纹理特征以及颜色的空间分布特征。本文的主要研究成果总结如下:1.深入分析和研究了基于内容的图像检索领域的一些关键技术,其内容包括颜色空间、图像主要低层特征(颜色、形状和纹理)的描述方法、图像特征间的相似性度量准则以及图像检索算法的性能评价方法等。2.在研究图像方块编码算法原理的基础上,提出了两种图像检索算法。(1)针对纹理分析法中,结构法和统计法各自存在的问题,提出了一种基于纹理基元的图像检索算法。首先,结合人眼的视觉特性,借鉴方块编码的思想定义图像的纹理基元,并构造了一种纹理基元共生矩阵,在此基础上,提取有意义的统计量来描述图像的纹理特征;同时,又提出采用纹理基元直方图来表征图像的形状特征;最后结合两种特征进行检索。(2)为了有效地利用成熟的文本检索技术,提出借鉴方块编码算法的思想来定义图像的关键子块,将图像看作文本,通过引入文本检索技术来进行图像检索。同时,又考虑到关键子块在图像中出现的频度对最后检索效果的影响,提出了相应的改进算法。3.提出了一种基于颜色矢量角的图像检索算法。充分利用颜色矢量角对图像的亮度变化不敏感而对色调和饱和度变化敏感的特性对彩色图像进行边缘提取,从而将图像中的像素点分为边缘点和平滑点两种类型,以此来提取图像的空间分布信息。针对图像中的边缘区,提出采用颜色矢量角直方图来表征其分布,而采用空间联合分布熵提取平滑区的特征。为避免由于颜色量化引起的误检问题,在提取联合分布熵时,分别针对彩色图像的三个颜色通道进行处理。最后结合两种特征,提出了相应的图像检索算法。4.在分析采用颜色直方图进行图像检索时存在问题的基础上,结合位平面和信息熵的概念,提出了一种基于位平面分布熵的图像检索算法。算法中利用位平面分解来提取图像的颜色空间分布信息,同时,也解决了利用直方图时存在的颜色量化和特征向量维数过高问题。在位平面分解时,考虑到图像微小的灰度变化对位平面的影响,提出采用位平面灰度码表示方法。同时,为避免位平面之间的相关性对最后的检索效率的影响,构造了权值矩阵,并采用马氏距离作为最后的相似性度量。5.提出了一种基于显著点的图像检索算法。在系统分析和研究了以往利用图像兴趣点进行图像检索算法的基础上,结合归一化的块逆概率差模型(BDIP,block difference of inverse probabilities),提出了一种显著点提取算法。即采用图像的块逆概率差模型提取图像的BDIP描述符,得到原图像的BDIP图像,用图像中一部分对表征图像有意义的数据来表示原图像。在此基础上,根据BDIP图像中像素的分布特点来提取图像的显著点。然后以它们为线索,把图像的形状特征和空间颜色分布特征有机地结合起来进行检索。该算法不仅解决了利用兴趣点进行检索时的缺陷,而且摆脱了传统的显著点特征描述的模式,算法简单,检索率高。6.提出了一种基于压缩域图像形状和纹理的检索算法。在分析DCT块内系数分布的基础上,根据其复杂度分布特点,采用非均匀量化的方法,提取DCT系数的加权复杂度直方图来描述图像的纹理特征;同时,利用DCT块中五个显著系数将DCT块分为不同类型的边缘块后,根据不同类型边缘块在图像中的分布构造了一种边缘空间分布图,在些基础上,提出采用边缘空间分布特征用于图像形状特征的描述。为避免空间布图中点的强度信息对最终检索效果的影响,又根据各类边缘强度的不同引入加权函数。最后将形状特征和纹理特征有机结合起来,用于图像检索。