论文部分内容阅读
视觉是人类观察世界、认知世界的重要功能手段。伴随着信息技术和计算机技术的发展,为了使用计算机等设备去模拟人眼的视觉功能,让其具有自己认知三维的空间环境,获取周遭的空间信息以及对应实物的形状、位置、姿态、运动等,并在其基础上描述、存储这些信息,深入地识别、感知三维内容,最终自行做出正确决策的判断。三维重建是计算机视觉的一项重要应用,因其涉及的学科知识极其繁多,研究的问题又极富挑战性,一直以来都是计算机视觉的热点和难点之一。而图像特征点提取与匹配的结果直接影响着三维重建的精确度,也是作为多传感器图像融合研究中的一项关键技术。 本文利用内、外部参数未知的两个摄像机来获取左右两幅图像,利用双目立体视觉基本原理,通过投影几何信息来研究三维图像重建方法,即恢复图像三维信息。而对于同一个三维场景,在不同的视点处拍摄的两幅图像间存在的内在的投影几何关系可以用极几何来描述,然后将极几何问题转化为对基本矩阵的估计问题。 基本矩阵在计算机视觉中具有十分重要的作用,它是从两幅图像进行三维重建的基本工具。基本矩阵包含了两幅图像中所有的几何信息,独立于场景结构,并且可以仅从两幅图像的对应点对中计算出来,而并不需要知道摄像机的任何信息。因此,精确地估算基本矩阵是非常重要的。本文的主要工作是对基本矩阵的估计进行了比较深入的研究,详细介绍了基本矩阵估计的三类方法,并对其中的一些算法进行改进: 1、对本文对SUSAN和Harris两种图像特征点提取算法进行了分析与性能测试,包括两种算法的定位准确性、提取速度和抗噪性三个方面的性能。接下来通过对基于奇异值分解的匹配算法的分析与抗噪声性能测试,发现这种算法的抗噪性比较强,可以提高匹配的鲁棒性。因此本文提出基于 Harris和奇异值分解的图像预处理算法; 2、提出了一种新型的基本矩阵迭代估计算法,该方法逐步剔除不良数据,而且矩阵的秩为2,点到极线的距离更小,即方差根小,平均值更接近于零。得到了在全局最优意义下的基本矩阵迭代估计方法,但该方法也有一定的缺点,需要进一步研究更快速的算法。