论文部分内容阅读
经过二十多年的发展,解决图像视觉特征与语义特征之间的差异问题已成为基于内容图像检索的研究热点。本文认为获取图像中不同目标的类别和相对位置信息是构建图像“语义特征”的重要基础。为此,深入研究了图像分类和图像多目标区域提取这两个“打好基础”的关键技术,主要研究工作包括: 1、从颜色、纹理、形状和伪语义信息四个方面研究了图像的低层特征。通过在Corel-1k图像库上的分类实验,分析、讨论了各种低层特征对不同类型图像的描述能力,为特征融合和图像分类积累丰富的先验知识。 2、设计实现了三种特征融合方法。其中前两种是“对症下药”的特征级融合方法,该类方法针对图像类型或者图像不同部分的特点选取适合的图像低层特征,再拼接这些特征作为融合特征。第三种是“机器学习”的决策级融合方法。该方法是在图像分类前,选择多种图像低层特征和对应的SVM核函数,然后利用SVM多重核函数学习方法不断调整各种特征的权重以训练出分类效果最优的分类器。本文分别使用三种方法对Corel-1k图像库进行了分类实验,结果表明根据图像特点选择互补性好的特征进行融合可以获得比单一特征更优的图像分类效果。 3、提取图像中多个目标区域。本文首先采用改进的光谱残差法、边缘检测和滑动窗口这三种方法分别提取出图像中候选目标区域,然后利用颜色对比度模型剔除非目标的候选区域,再利用一种新的超像素块模型构造目标区域的评价函数,最后选取评价值较高的候选区域作为最终的目标区域。在Corel-1k图像库上将本文的目标区域提取效果与目前几种先进的算法作了效果对比,并在MSRC-v2图像库上根据手工标注的目标区域进一步测试了本文算法的性能,结果表明本文方法可以有效提取图像中不同尺度的多个目标区域,但是仍有一些不足需要改进。最后,提出了一个三层的图像多目标区域提取框架。前两层结构可以不断融入新方法来提高目标区域提取能力,最后一层结构可自行定义以提取出满足特定需求的目标区域,为构建语义信息打下坚实基础。 本文使用C++,OpenCV,Matlab和SQLServer数据库构建了以上述算法为基础的图像检索系统。