论文部分内容阅读
计算机视觉的一个长远目标是通过视觉图像来理解世界。随着移动智能终端设备的普及和网络技术的发展,视觉信息大量涌现。如何通过计算机视觉技术实现对视觉信息的分析,进而有效地对其进行组织、表达、管理和检索,成为当今科研领域和工业界亟待解决的问题。其中,图像分割技术受到越来越多的关注,被认为是实现图像理解的一种有效途径。早期的图像分割技术是利用图像的颜色外观特征来完成的。图像被分割为外观特征一致的一些区域。然而,在现实世界中,物体不是仅由颜色外观特征的一致性来定义的,而是在本质上由物体在三维世界中的物理连通性所决定。基于颜色外观特征聚类的图像分割技术通常无法得到语义一致的图像分割结果。这促使人们寻找新的图像分割技术。传统图像分割技术将图像作为二维模式来处理,然而,图像是三维世界在二维摄影平面的投影。因此,有必要结合场景深度信息来指导图像分割。这将为得到具有语义意义的图像分割结果提供一种可能的解决方案。在上述研究背景下,本文针对结合场景深度信息的图像分割问题展开研究,提出了一系列新颖的图像分割算法,有效地解决了基于颜色外观特征的图像分割算法面临的过分割和欠分割问题。为图像理解领域的发展奠定了一定的基础。本文的创新点和主要贡献如下:1.传统的基于颜色特征的图像分割算法没有充分利用物体在三维世界中的分段连通性,从而存在所谓的过分割和欠分割问题。为此,本文提出了一种基于深度不连续性选取种子区域的图像分割算法:首先结合图像的深度和颜色信息抽取可靠的、与物体的真实边缘相一致的深度不连续边缘,然后完成颜色过分割处理,并在不连续边缘附近选取种子区域,最后利用图割(Graph Cut)优化算法为未贴标签的过分割区域分配标签。本文所提出的图像分割算法既能有效分离深度上不连续的三维“悬浮”物体,也能成功分离相互之间有接触(即有支撑和被支撑关系)的两个三维“非悬浮”物体,较好地解决了图像的语义分割问题。2.深度不连续作为三维世界物体之间遮挡的线索,越来越多地被应用于图像分割。但是,以往的基于深度图的图像分割算法往往局限于将整个场景分割为深度一致的区域,而在三维世界中,相互之间具有支撑与被支撑关系的两个物体在接触处深度是连续的。这使得基于深度图的图像分割算法无法将支撑物与被支撑物分开。为此,本文提出了基于物体间支撑分析的图像分割方法:首先结合场景的深度图对物体间存在的支撑关系进行分析,将场景中表面法向量近似垂直于水平面的区域作为支撑区域。在此基础上,利用深度信息分别在支撑区域和非支撑区域完成图像分割,从而将相互间有接触的两个物体分割开。3.场景的几何结构信息作为对场景理解和物体识别的有效途径,近年来得到广泛研究。但是,以往的场景几何结构分析往往局限于使用颜色外观特征作为线索,据此将场景近似分为地面区域、垂直区域以及天空等一些区域。以往的方法由于忽略了场景深度特征与几何结构之间存在的强相关性,导致几何结构分类结果不一定符合场景本身所包含的语义结构。为此,本文提出结合深度信息和颜色外观特征的场景几何结构分析方法。实验结果表明,本文方法显著提高了对场景几何结构分类的精确度,从而提升了图像分割的整体效果。图像分割技术涉及到计算机视觉、机器学习以及认知科学等多个交叉学科,希望本文的研究工作能够为相关领域的研究提供一些帮助。