论文部分内容阅读
基于图像的多视图立体几何稠密三维重建是计算机视觉领域的一大研究热点,在机器人、无人机、自动驾驶等领域有着广泛的应用。多视图立体几何的稠密重建相比于从运动恢复结构的稀疏重建,可以获得更加完整和稠密的三维模型,更加符合人们的需求。然后在面对大规模场景的稠密重建时,场景中经常会出现一些纹理缺失或者纹理微弱的区域,导致几乎所有的多视图立体几何方法都无法在这种区域进行重建。此外,随着数码摄像机、智能手机等设备的发展,所拍摄的图像的分辨率变得越来越高,如果在利用高分辨率图像对大规模场景进行稠密重建时,重建时间过长的问题也是需要克服的难题。本文对基于高分辨率图像集的大规模场景的快速稠密重建展开了较为系统的研究和分析。面对大规模场景中纹理微弱区域无法重建以及图像分辨率过高等问题带来的挑战,提出了两种新的算法,以减缓上述困难对稠密重建带来的冲击。本文的研究内容和主要贡献为:(1)提出了一种多尺度图像纹理增强的方法。通过保边滤波器对图像进行多尺度双边分解,生成包含图像主要边界信息的滤波图像和包含各种尺度的纹理信息的差异图像,然后自适应地组合滤波图像和差异图像,最后生成纹理增强后的图像。利用纹理增强后的图像进行多视图立体几何计算时,可以得到更多的特征匹配对,尤其是在纹理微弱的图像区域,进而使得重建出来的三维模型的几何细节更加突出。(2)提出了一种有选择性的联合双边传播上采样方法。在利用联合双边上采样中双边权重的基础上,有选择性地在邻域窗口中挑选双边权重最高的一些像素作为候选插值点。此外,本文还提出了深度传播策略,把选择的候选点的深度值沿着它们的三维局部切平面进行深度传播,然后利用传播后的深度值进行最后的加权平均,可以生成更加准确的上采样深度图。本文提出来的该方法不仅可以缩短重建的时间,而且还大大增加了重建三维模型的完整度和稠密度。综上所述,本文将从图像的纹理增强和深度图与法向量图的上采样两个方面展开研究,为基于高分辨率图像集的大规模场景的快速稠密重建提供新的理论和方法。为了证实本文提出方法的有效性,本文在最新最标准的多视图立体几何数据集上进行了大量定性和定量的实验比较。此外,本文提出来的方法具有很高的可扩展性,可以应用到现有的基于Patch块匹配的多视图立体几何方法中。