论文部分内容阅读
图像分割是指根据像素特征,将数字图像细分为多个互不重叠区域的过程。分割的目的在于直观表达图像区域所包含的信息以及各区域间的关系。本文的工作是寻找一个能够挖掘图像区域间关联信息的模型,从而有效地指导图像分割,并实现语义理解。语义分割问题可以归结为标注问题,即为图像的每个像素赋予特定标记。这些离散标记的内容依赖于具体任务,例如它们对应于不同的目标类别、不同的深度或者不同的亮度,而所有标注问题都可由概率图模型进行建模。本文采用基于不同分割粒度的高阶条件随机场建模,使用启发式算法学习模型参数,使用经典的图割算法进行模型推理。本文的主要工作内容如下:(1)本文采用高阶条件随机场模型建模,以不同量化度的图像作为多层条件随机场模型的基础架构,包括一层像素层和三种不同分割粒度的超像素层,分割层采用经典的Mean-shift无监督分割算法实现。(2)关于单元势和成对势。在像素层,本文采用基于像素点的稠密特征计算像素的标注概率,并采用多组矩形滤波器来捕获像素点特征的空间布局信息,以此作为Boosting算法的弱分类器,训练出可用于计算观察点单元势的强分类器,采用对比度敏感势计算像素间的成对势;在超像素层,统计区域内主标签作为单元势能,计算相邻区域的特征直方图距离作为成对势能。(3)关于层间势能。为了区分各种不连续标签对主标签的偏离程度,本文在传统的高阶条件随机场的基础上,提出一种基于分割质量的层间势能,我们依据特征方差来确定标签不一致像素的惩罚力度,并引入容错截断阈值,允许了小范围的标记不一致,这样的改进使模型设计更加合理,也更具鲁棒性。在MSRC-21数据库上,本文模型比低阶条件随机场模型的平均标注准确率提高了18.1%,比传统的高阶条件随机场模型的平均标注准确率提高了6.3%。