论文部分内容阅读
鲁棒模型拟合旨在从包含离群点和噪声的数据中拟合出有意义的模型实例。该方向是计算机视觉领域的一个关键方向,相关算法与方法已被广泛应用于模式识别和机器学习等多个领域,如车道线监测、运动分割、图像拼接和光流估计等。随着人工智能产业的快速发展,人工智能系统所处理的数据不可避免地存在由传感器、环境或人为等因素产生的离群点或噪声,这给鲁棒模型拟合带来了巨大的挑战。此外,多结构数据通常包含多个模型实例,而这些模型实例的内点数量往往存在着不平衡且交叉分布的情况。这进一步导致传统的模型拟合方法在精度和速度上难以满足实际工程应用的需求。本文立足于多结构数据,针对不平衡数据、无效模型假设和高比例离群点三个关键问题,研究如何构建有效且鲁棒的模型拟合方法以提升拟合精度和计算效率,探索如何融合不同类型基本模型的优势以分割存在遮挡或表观变化的多个运动物体(即,多结构数据)。由此,本文提出了四种面向多结构数据的鲁棒模型拟合方法。本文的主要研究内容和创新点如下:(1)针对多结构数据的内点不平衡问题,提出了一种基于超图优化的模型拟合方法。由于多结构数据的每个结构所包含的内点数量往往存在偏差(即,数据不平衡),进而可能会导致一些仅包含少量内点的结构被忽略。为此,该方法首先构造一个简单的初始化超图,其中超图的顶点表示数据点,超边表示模型假设。然后,提出了 一个迭代超边优化算法对初始化超图的超边进行优化,以降低超图的计算复杂度。接着,提出了一个自适应内点噪声尺度估计算法,来分离显著顶点和不显著的顶点,其中不显著的顶点被用来引导后续对其它结构的采样。最后,使用谱聚类算法对优化后的超图进行分割,以获得多结构数据的模型实例。实验结果表明,基于超图优化的模型拟合方法能有效降低超图的计算复杂度,并取得良好的分割结果。在分割精度上,该方法比当前流行的方法T-Linkage和RPA分别提升了约50.4%和40.6%;在分割速度上,该方法比T-Linkage和RPA分别快了约110.9倍和76.1倍。(2)针对从多结构数据采样获得的模型假设质量不高问题,提出了一种基于非负矩阵欠逼近和剪枝技术的模型拟合方法。模型拟合方法需要通过随机采样来生成大量模型假设,以提高命中真实模型实例的概率。然而,由此而产生的大量无效模型假设会影响模型拟合的准确性。为此,该方法首先利用所提出的误匹配剪枝算法来移除误匹配,以减少离群点对采样算法的影响,进而提高生成模型假设的质量。然后,通过模型假设剪枝算法来移除无效模型假设,以构造高质量的非负偏好矩阵。最后,利用融合空间约束和稀疏约束的非负矩阵欠逼近算法和结构合并策略,以自适应地估计模型实例的数量和参数。实验结果表明,基于非负矩阵欠逼近和剪枝技术的模型拟合方法能在包含大量离群点的多结构数据中有效地估计出模型实例的数量和参数,并能取得较好的分割结果。在分割精度上,该方法比当前具有代表性的方法T-Linkage和RS-NMU分别提升了约197.2%和47.7%;在分割速度上,该方法比T-Linkage和RS-NMU分别快了约2.3倍和1.9倍。(3)针对多结构数据存在高比例离群点问题,提出了一种基于层次化信息传播的模型拟合方法。真实场景的多结构数据通常包含高比例离群点,且生成的模型假设质量不高,从而造成拟合精度下降。为此,该方法首先通过融合一致性信息分析和偏好性信息分析的优点来构造一个层次化网络模型。然后,提出了一个新颖的层次化信息传播算法以修剪该网络的两层节点(分别对应于数据点和模型假设),进而减少高比例离群点和无效模型假设对算法的影响。接着,提出了一个改进的仿射传播算法,对修剪后的数据点进行聚类,从而估计出模型实例的数量和参数。实验结果表明,本文所提方法在多种类型的多结构数据中能较快速和准确地拟合出模型实例,并获得较好的分割结果。在分割精度上,该方法比当前流行的方法T-Linkage和RansaCov分别提升了约84.6%和67.0%;在分割速度上,该方法比T-Linkage 和 RansaCov 分别快了约 22.6 倍和 31.0 倍。(4)针对运动目标存在遮挡及表观变化等问题,提出了一种基于注意力引导异质模型的模型拟合方法。真实场景中外界的光照变化、目标表观或遮挡等因素会导致视频序列不可避免地缺失部分目标信息。为此,该方法提出通过融合不同类型基本模型的优势,以减少因光照变化、目标表观或遮挡等因素带来的影响。首先,提出了一个注意力引导的异质模型构造算法,通过注意力引导异质模型来构造高质量的累加相关矩阵。然后,提出了一个自适应的异质模型优化算法,将累加相关矩阵优化为稀疏仿射矩阵,以抑制不同运动物体之间的相关性。最后,提出一个异质模型分割算法,通过利用融合后的稀疏仿射矩阵来分割多个运动物体。实验结果表明,基于注意力引导的异质模型拟合方法在四个流行且具有挑战性的数据集上均获得了优越的分割结果。在分割精度上,该方法比当前具有代表性的方法SSC和SUBSET分别提升了约639.7%和76.4%;在分割速度上,该方法比SUBSET快了约1.5倍。