论文部分内容阅读
基于立体视觉的三维重建是计算机视觉领域的研究热点,在机器人导航、虚拟现实、建筑、工业设计等方面有重要作用。目前大多数三维重建研究工作集中在针对单个物体的三维建模上,或者是稀疏特征点的三维重建,本文提出了一种大规模场景的三维重建方法,首先用双目立体相机拍摄场景的图像序列,然后用视觉里程计计算出相机拍摄各帧图像的运动轨迹,并通过立体匹配获得各帧图像的视差图进而计算出点云数据,最后对视觉里程计和立体匹配的数据结合,把各帧点云数据根据相机运动轨迹统一到全局世界坐标系下,获得整个场景的一致的三维点云数据。本文的研究工作主要有以下几个方面。(1)为了获得相机拍摄各帧图像位置的运动轨迹,提出了一种基于单位四元数的双目立体视觉里程计方法。首先提取立体图像序列中的尺度不变特征,利用圈匹配技术对特征匹配和跟踪;然后采用单位四元数法求解相邻帧间的旋转矩阵和平移向量,通过最小化重投影误差法多次迭代优化获得最优运动参数;最后对各个相邻帧间的运动参数累积变换,得到相机的运动轨迹。分别在室内外环境中进行了实验,表明本文方法定位准确,鲁棒性强。(2)立体匹配可以获得立体图像对的视差图,进而恢复出深度信息,本文提出了一种基于双重分割的立体匹配算法。首先对参考图像进行颜色欠分割,使每个区域包含足够的信息进行平面拟合;然后对初始匹配视差图进行分割,检测颜色分割中的欠分割区域并进行再分割,进而对再分割后的区域进行平面拟合;最后利用合作算法对不可信区域优化,以提高匹配算法的运行效率。用标准图像测试集和实际场景图像进行实验,结果表明本文算法匹配精度较高,时间开销较少。(3)根据视觉里程计得到的相机运动轨迹把立体匹配得到的各帧图像点云变换到统一的全局坐标系下,可以得到整个场景的三维点云。为了解决点云数据增长过快的问题,本文提出了一种关键帧数据融合方法。首先检测出图像序列的关键帧,然后对关键帧的点云数据进行融合,并用重投影法检测相邻关键帧之间的重叠区域,保留其点云均值,进一步去除冗余。实验证明本文方法可以有效重建出场景的三维点云数据,并且冗余数据较少。