论文部分内容阅读
图像语义分割技术(Semantic Segmentation)一直以来都是计算机视觉中的一个具有挑战性的任务,在图像理解中起着核心作用。图像语义分割是把图像分割和图像的识别与理解结合起来,其主要目的是精确地分割物体,并赋予图像中每个像素一个语义标签。图像语义分割能够快速而有效获取视频或图像内容中的表达,高效地为互联网用户提供有用的信息。深度学习是近年来机器学习研究中的一个新领域,其具有强大的学习能力,高效的特征表达能力,从像素级原始数据到抽象的语义概念逐层提取图像信息,这使得深度学习模型在提取图像的全局特征和上下文信息方面具有突出的优势。深度学习的提出也为解决图像语义分割问题带来了新的思路。本文受目前流行的深度学习模型思想启发,采用基于全卷积神经网络模型,结合引入目标检测信息的高阶条件随机场,实现自然图像的语义分割。本文根据目前的研究现状,主要进行了以下工作:(1)总结目前语义图像分割的研究现状,介绍条件随机场的基本概念与原理,指出了其存在的优点与不足,并引出高阶条件随机场模型,有效改善了图像分割精度。(2)深入探讨卷积神经网络的理论与结构模型,介绍目前最为流行的完全卷积网络在语义图像分割中的应用,并将完全卷积网络用于自动的前列腺磁共振图像分割,实验证明该模型优于传统的前列腺图像分割算法。(3)针对目前基于点对条件随机场语义分割算法存在的边界分割错误与识别错误,提出一种基于目标检测信息的高阶条件随机场模型,并将其与完全卷积网络模型结合,使高阶条件随机场模型的训练与卷积网络模型训练统一在一个系统框架中,改进语义图像的分割精度。在MSRC-21与PASCALVOC2011数据库上的实验结果证明,基于目标检测的高阶条件随机场卷积网络模型分割性能优于其他算法。