论文部分内容阅读
数字图像分割是计算机视觉及多媒体处理的基础工作。随着近些年网络图像的海量出现及图像数据规模的不断增加,众多实际应用对图像分割的需求由小规模的单幅图像分割不断向大规模的图像间协同分割发展,即图像协同分割问题。在过去数年中多种协同分割算法被相继提出并成功地应用于实际问题中。但由于起步较晚,协同分割在基础模型构建与理论分析及图像间语义区域相似性衡量分析等核心问题上进展缓慢。同时在与实际问题的结合中也暴露了协同分割性能不足的挑战。研究有效的协同分割模型构建理论、语义前景相似性衡量模型并改善实际应用中协同分割的分割性能是众多计算机视觉和多媒体应用的迫切需求,因此,本文开展了对协同分割理论和应用方面问题的研究。基于实际应用中共同对象的数量及提取的难易,本文进行了单类对象协同分割、多类对象协同分割以及复杂场景协同分割等多个问题的研究,针对协同分割的模型构建及区域一致性衡量等核心问题进行了探讨,同时进行了协同分割实际应用的研究。具体的研究内容和创新点包括如下几方面:第一,研究了协同分割的基础问题即基于颜色底层特征的单类对象协同分割问题,针对颜色底层特征提出了区域一致性衡量方法及协同分割模型构建方法,基于一致性衡量方法构建了基于主动轮廓的协同分割模型及理论分析方法。该模型能够从一对图像中有效地提取出拥有相同底层特征的共同对象区域,为协同分割研究提供了基础的模型设计框架及理论分析方法。第二,针对颜色底层特征无法准确提取颜色变化的共同对象问题,进行了基于中层语义特征的协同分割研究,考虑了显著和形状等中层语义信息,分别提出了基于显著性和最短路径的协同分割模型及基于方向形状描述符和中值图理论的形状模板生成及匹配模型。前者在协同分割中引入显著信息,以提高协同分割结果的语义性。后者则集中相似形状的挖掘和建模,能够从一组图像中准确地检测、匹配和构建相似形状信息,适合于图像数据动态增长的协同分割问题。所提出的两种基于中层语义特征的协同分割模型能够有效地获取中高层语义下的对象区域,能够为高层应用提供了更具语义的协同分割结果。第三,针对区域一致性衡量的特征自适应学习难题,进行了特征自适应协同分割研究,提出了基于图像复杂性分析和特征自适应学习的协同分割模型,包括图像复杂性分析方法、区域语义一致性衡量模型及模型自适应学习方法。该框架能够自适应学习给定图像组的区域一致衡量模型,解决了协同分割在实际应用中受限于共同特征未知的瓶颈,扩展了协同分割的应用范围。第四,针对图像组多类共同对象的分割问题,进行了多类对象协同分割研究,提出了基于有向图聚类的多前景协同分割模型及多组图像协同分割框架。前者针对现实中图像组包含多类前景的可能,将多前景的提取问题描述为多区域的聚类问题,并通过分割传播策略实现多前景的提取。后者则针对普遍存在的多图像组协同分割问题,提出了多组图像协同分割框架。该框架在协同分割的基础上引入图像组间的协同分割,能够从多组图像中提取更准确的共同对象区域,并利用不同组间分割信息的传递,进一步提升协同分割的性能。第五,针对协同分割在更困难的复杂场景下分割性能不足的问题,进行了复杂场景协同分割问题的研究,提出了相似场景协同分割模型。该模型针对图像组中的图像经常拍摄于同一场景的问题,在基于主动轮廓的协同分割模型基础上考虑了图像间背景的一致性约束,构建了适合于拥有相同背景的图像组协同分割模型并进行了理论分析,能够从同一场景中提取出感兴趣对象,达到了预期目标。第六,基于提出的协同分割模型,进行了协同分割实际应用方面的研究,针对电子商务应用对商品对象定位和分割的需求,提出了从商标到对象的分割方法。该方法基于协同分割模板生成方法及商标定位方法,提出了基于商标的形状描述模型以及形状匹配模型,能够在多种对象形变下快速准确地从复杂场景中定位和分割出商品区域,取得了预期的效果。