论文部分内容阅读
基于内容的图像检索技术具有广阔的应用前景,低层视觉特征与高层语义特征之间的“语义鸿沟”是制约该技术应用的主要问题。本文围绕基于内容的图像检索技术中的“语义鸿沟”问题,对相关反馈技术和图像语义分析技术进行了研究,完成的主要工作包括:针对相关反馈的小样本、正负样本集的不对称、以及图像检索中的标识样本与未标识样本之间的不平衡问题,提出了基于主动学习支持向量机的相关反馈图像检索方法。在选择参与主动学习的样本时,提出了基于低层视觉特征相似度和支持向量机最优分割面的确定策略,选择离分割面最近的负样本参与主动学习,该策略遵循主动学习的本质,避免了不确定性样本选择策略的随机性;在主动学习过程中,设计自适应正则化规则,选择最合适的正则化参数,提升了系统的泛化性。实验表明,该方法有效地提升了图像检索效率,检索系统具有更高的准确性和更好的泛化性。针对全局特征表达图像语义准确性低的问题,研究了图像局部区域分割技术,提出了基于对象语义的图像分类方法。设计了一种基于高斯混合模型和条件随机场的对象区域分割方法,获得图像中的对象区域;利用多层感知器进行有监督学习,生成对象语义模板,解决对象语义相似度的问题;利用训练好的对象语义模板,对图像进行分类。实验表明,提出的分类方法对于二语义图像具有很高的分类准确率。传统的图割方法在对多标签语义图像进行分割时,计算复杂度非常高。针对这个问题,提出了基于图割的多标签图像语义自动分割方法。利用主颜色区域作为标签种子,不需要先验知识,也不需要选择种子像素或区域,降低了因选用像素或超像素而引起的计算复杂度;利用α-扩展移动算法进行优化,提升分割速度。实验表明,该自动分割算法具有较快的分割速度和较好的分割准确率,且比人工配置的多标签分割有更好的性能。针对视觉词袋在图像语义分类中准确性低、消耗时间长的问题,提出了基于语义词袋的检索方法。在语义区域分割的基础上,利用支持向量机进行语义标注和分类;用区域语义词汇代替传统的视觉词汇,精炼图像语义表达的准确性,减少语义词汇量。实验表明,该方法提高了图像语义表达的准确性,具有更好的检索性能。