论文部分内容阅读
在计算机视觉中,通过摄像机系统去实现三维空间信息的感知一直是计算机视觉的研究热点之一。国际上利用针孔摄像机模型来进行摄像机标定,用图像序列间的几何约束来实现对于空间拼接方法的研究也逐渐成熟和完善。伴随着Kinect等一系列TOF摄像机系统的出现,如何对这类摄像机系统进行摄像机标定以及利用其本身存在的几何约束和图像序列间的关系实现空间拼接是一个至关重要的研究任务。本文从Kinect摄像机模型的几何结构出发,研究了基于非线性空间的图像校正、Kinect摄像机标定,并在此基础之上实现了空间的拼接。具体包括:(1)在统一非线性摄像机模型RTCam下,研究了图像几何失真校正算法,该方法只需要利用图像序列间存在的几何约束,就可以实现对于复杂几何失真图像数据的校正,特别适合于广角摄像头、鱼眼摄像头等非线性成像系统所成的图像。(2)研究了Kinect摄像机的几何结构,直接利用RGB颜色信息对Kinect成像系统进行标定,并利用摄像机系统中存在的几何约束,通过基于相机对的重投影最小值非线性优化得到高精度的摄像机内外参数。(3)研究了Kinect深度数据中存在的无效深度信息的问题,利用基于像素邻域的多帧深度图像修复方法去填充深度图像中无效的深度信息,然后利用图像数据和点云数据之间信息的冗余,改进了RGBD-ICP算法,实现了基于Kinect的空间拼接方法。本文的研究成果和方法对于多摄像头协同工作的系统的标定以及深空空间的探测具有很重要的作用。同时,研究的RTCam统一摄像机模型具有很高的理论创新性,可以用来解决非线性空间中存在的问题。