论文部分内容阅读
基于语义信息的图像分类是解决语义图像理解与分析的重要途径。反映图像中对象之间相互关系的图像上下文信息,既是人类视觉识别系统中的重要信息来源,也是重要的图像语义信息。近年来,将图像上下文信息作为图像本身体现的主要知识信息,以及视觉特征和上下文信息的融合利用已成为语义图像理解与分析的潜在趋势。换言之,对于基于语义的图像理解与分类问题来说,图像上下文信息有助于提高其准确性。不过,当前在利用上下文信息的模型和方法上还没成熟,大部分研究都没有充分合理地利用图像上下文信息。本文针对图像语义分类中存在的问题,提出一种基于上下文信息的语义图像分类方案,展开了利用上下文信息的图像分析研究,包括语义图像描述、图像分割、区域标注以及图像语义分类,取得了一些创新性成果。全文的主要贡献概括如下:(1)合适的图像内容描述是合理利用图像语义信息的先决条件,也是语义图像分类的先决问题之一。针对语义层次上的图像内容描述问题,本文通过图结构提出了基于上下文信息的图像语义内容描述方法,包括基于条件随机场和能量模型的图像上下文模型和基于属性关系图的图像语义内容描述模型。从而为解决利用上下文信息的区域标注和图像场景语义分类问题提供理论基础。(2)利用图像空间上下文信息等语义信息来进行分割图像,是提高基于语义的图像理解与分类性能的一个重要途径。本文面向基于语义的图像分割,提出一种利用图像中对象之间空间上下文关系的图像分割方法。该方法首先引入图像像素的局部空间上下文的模糊C均值聚类算法实施图像初始分割。然后,根据分割区域的空间上下文信息执行[区域合并,修正过分割的区域并得到了符合空间上一下文条件的语义对象区域。(3)基于语义的图像分类需要获取图像对象的语义信息,即需要分割区域的对象识别工作。为了提高图像区域的对象识别准确性,本文提出一种利用语义上下文和空间上下文信息的基于能量的图像区域标注方法,通过图像区域的视觉信息和图像上下文信息的融合利用,进行稳定的对象标注并提高其准确性。基于能量的方法通过在节点集上定义合适的势函数,包括区域-对象对应势函数和对象之间相互作用势函数,并且通过全能量的最小化来得到最终区域标注结果,因而避免概率图模型中存在的分配函数估计问题。(4)充分利用图像中的语义对象信息及其空间结构信息是提高图像分类准确度的重要措施。针对基于语义信息的图像分类,本文提出一种基于上下文信息的图像分类方法。该方法根据本文提出的基于属性关系图的图像描述模型,有效地利用了图像中的语义对象信息及其空间关系信息。同时,根据本文提出的图像场景语义距离度量方法,采用SVM分类器获得贝叶斯网络的条件概率分布,可以很好地解决稀少训练样本下的概率分析问题,从而提高贝叶斯网络的分类准确性。实验结果表明了这种方法的有效性与可靠性。