论文部分内容阅读
为更好地理解、分析图像中的目标,需要将其从复杂的图像内容中分离开来,即图像分割问题。图像分割是模式识别和计算机视觉领域中重要的研究内容,是从图像处理到图像分析、图像理解的关键环节,在医疗诊断、视频监控、遥感图像分析、图像目标提取与检测等多种研究中得到了广泛应用。目前有多种方法可以用来解决图像分割问题,但迄今为止依然不存在一种普适的方法。在现实应用中,分割结果容易受到复杂背景、遮挡等各种因素的影响,而使用形状先验来辅助分割图像中的目标是一种有效的方式。本文在图像分割算法和深度学习理论基础上,研究了基于深度学习的形状模型,然后利用先验形状信息解决图像分割问题。论文的主要工作和创新点在于:(1)针对形状建模问题,提出一种基于深度学习的形状表示模型,它是一种生成模型,用以表示形状和生成形状。根据模型的结构特点,给出了模型的构造方法和训练方法,利用形状的底层特征和多层高层特征建立了一种先验形状表示和估计的方法。实验结果表明,该类模型不仅能够很好的拟合训练形状,还能够生成不同于训练样本的形状。当训练形状是多类别时,模型同样能够定义形状的多峰分布。(2)在利用图像光谱信息等底层数据特征的传统图像分割方法基础上,结合深度学习形状模型,提出一种基于条件深度玻尔兹曼机的图像分割模型。该模型结合图像底层数据特征和形状先验信息对图像进行分割,模型中使用深度玻尔兹曼机提取输出空间数据的分布结构,为图像分割提供形状先验信息,进而提高图像分割的准确性。实验结果表明,由于提出的模型利用先验形状信息,考虑了输出空间的高阶相关性,所以对存在遮挡、背景混乱等干扰因素的自然图像进行分割时,取得了不错的效果。(3)提出了一种结合深度学习形状先验的马尔科夫随机场图像分割方法。该方法使用深度学习形状模型建立目标先验形状的表示和估计方法,采用水平集中的符号距离函数进行形状相似性度量,定义形状能量项,并将其与原有的能量函数结合在一起,得到包含外观信息和形状先验信息的分割能量函数,然后使用图割推理算法对分割能量函数进行最小化求解得到图像的分割结果。通过形状先验信息与外观信息的结合,产生叠加增强的效果,利用先验形状对分割的约束,减少干扰因素对分割结果的影响。实验结果表明,在利用图像底层数据信息的马尔科夫随机场图像分割方法中,引入形状先验信息能够有效改善图像的分割结果,分割出正确的目标。