论文部分内容阅读
随着多媒体技术和Internet网络技术的快速发展,人们越来越多地接触到各种各样的图像信息。面对海量的图像资源,用来快速而准确地找到所需图像的检索技术成为多媒体领域的一个研究热点。近年来,基于内容的图像检索技术已成为国内外广泛关注的焦点,并在许多领域得到了广泛的应用。但是到目前为止这项技术还存在许多亟待解决的问题,本文在这方面做了一系列比较深入的研究,取得的主要成果:第一,为了去除噪声对图像检索的影响,提出了改进的双边滤波算法和基于改进的非局部均值与非下采样Contourlet变换(NSCT)Wiener滤波的图像去噪两种算法。前者用维纳函数对当前像素点和邻域像素点灰度值进行估计,在此基础上计算像素亮度相似度权值,从而减少噪声对加权系数的干扰。重点介绍后者,后者是一种结合空域和变换域的去噪方法,首先在空域中对加噪图像运用小窗口的改进非局部均值算法去除高频噪声,然后在NSTC域中采用维纳滤波算法消除低频噪声并重建图像。同时针对非局部均值算法的去噪性能、计算复杂度、参数估计提出了改进方法。实验结果证明无论是客观评价指标上还是主观视觉效果上,本文提出的算法都有一定的优势。第二,提出一种基于颜色-空间分布特征的图像检索算法,可以有效克服传统的颜色直方图无法反映颜色空间分布信息的缺陷。该算法既考虑了像素的位置重要性又考虑了同种颜色像素空间分布特性。以人眼视觉注意机制为基础,利用像素与其多尺度邻域颜色对比度对相应像素点进行加权处理,构造出能有效反映原始图像中像素位置重要性的加权颜色直方图。同时采用颜色空间分布离散度来描述图像中同种颜色的像素空间分布特征。仿真实验结果表明,检索结果能较好地满足人的视觉感受。第三,准确地提取出图像中用户感兴趣的部分是解决基于区域的图像检索问题的关键。提出一种基于视觉注意力模型的图像检索算法,该算法首先采用结合高斯多尺度变换和颜色复杂度计算的视觉注意力模型生成显著图,在此基础上采用最大类间方差动态阈值法提取显著目标,并利用生成的显著图与基于Canny算子提取的初始图像边缘共同提取显著区域的边缘。最后,结合显著目标的颜色直方图和显著边缘的梯度方向直方图实现区域级的图像检索。第四,提出一种基于视觉有效区域的颜色和对象二级语义的图像检索算法,可以有效克服图像低层视觉特征和高层语义之间的“鸿沟”。结合像素的全局显著度和角点分布信息获得包括单个感兴趣目标的视觉有效区域,在此基础上,提取有效区域的主颜色做为颜色特征语义,采用支持向量机(SVM)机器学习算法获取区域的对象语义,最后根据颜色和对象语义实现图像二级语义检索。