论文部分内容阅读
从一个静态场景的多幅未标定视图来同时恢复摄像机的运动和场景的三维结构是计算机视觉领域的一个基本问题,拥有着广泛的应用前景。其理论基础多视图几何学在经过了20多年的深入研究后也在近年迈向成熟,相关的教科书也已经相继面世。本文要挑战的问题是如何在输入大量无组织的多视图图像上实现自动化的度量重建。难点主要体现在两个方面:(1)如果输入的图像组是有序的,如视频序列,则重建可以通过分层迭代的策略来实现;而对于没有任何先验信息的无序图像组,如何采取合适的重建策略是亟待解决的问题,目前的解决方案也只能有效的处理输入视图数较少的情况。(2)现有的系统在重建过程中需要大量专家级的人机交互,实现完全自动化的多视图重建对系统的鲁棒性提出了新的挑战。本文针对多视图重建的各个子模块提出了改良算法;并提出了一种新颖的基于图论的多视图重建策略,该策略完全不依赖输入图像组的序列信息;最终实现了一个高性能高鲁棒性的自动化多视图重建系统。基础矩阵鲁棒性估计的主流算法是随机抽样一致性算法RANSAC,我们分析了RANSAC在理论和应用上的缺陷并提出了两种新算法:自适应Tc,d预检验RANSAC以及基于高斯混合模型GMM的随机抽样最大似然算法GMSAC。自适应Tc,d预检验使用了近似优化的预检验参数选择实现了自适应的RANSAC加速。GMSAC详细分析了局外点的成因,并针对不同成因的局外点采用了不同参数集的GMM建模,实现了基础矩阵的最大似然估计。提出了一种最小化重投影误差的线性射影重建方法,算法实现基于场景结构、摄像机运动以及射影深度之间的加权交替最小二乘法。本射影重建算法可以与作为射影光束法平差的引导算法或者组成混合算法,有效的提高射影重建的效率与精度。提出了一种基于双向准仿射重建的度量重建方法。使用准仿射重建作为度量重建的中间步骤可以增加算法取得全局最优的机会,提升重建质量。我们在多个不同类型的图像组上进行了系统实验,包括室内与室外的图像组。实验结果表明,本文的系统能够在不依赖任何人机交互的情况下在复杂的无组织图像组上输出质量良好度量重建结果。