论文部分内容阅读
近年来,随着计算机视觉领域相关技术正如火如荼的发展着,三维重建越来越受到相关专家学者的重视。而随着三维重建场景的复杂度越来越高,以及重建精度的要求越来越高,重建的难度也随之增加。其中,主要体现在几个方面,例如静态场景下动态物体的干扰,背景以及其他非重建目标的干扰,环境噪声影响采集三维点云的精度、点云之间的相互遮挡等,这些因素都会影响到重建精度和准确性。近年来提出的相关方法多分为两类,一类是针对固定静态场景的三维建模,另一类针对动态物体将其置于旋转平台上,利用静态相机捕捉图像,进而获得不同角度下的物体点云数据。本论文将综合这两方面的实验场景,探讨动态相机拍摄动态旋转物体的姿态位置,实现复杂场景下的目标物体重构,并进一步估计出目标物体的运动信息。本课题采用基于Real Sense的结构光相机来获得目标的RGB-D图像数据。本文首先介绍了针孔成像模型并建立了结构光的视觉成像模型,推导了根据RGB-D图像数据还原三维空间点坐标的方法。然后针对物体重建这一课题,本文引入图像预处理模块。这里主要分为物体跟踪和物体分割两大模块,借助物体跟踪缩小目标感兴趣区域以提高物体分割的准确度。物体跟踪模块采用的是核相关的KCF跟踪算法,物体分割则是采用了Grab Cut算法,KCF跟踪得到的ROI矩阵可以直接导入Grab Cut算法,进而整合整个预处理模块。图像预处理完成后,对于分割得到的RGB-D图像数据可以合成为三维点云数据。针对不同物体的纹理特征和几何特征疏密程度不同,本文采用加权结合SIFT特征点和FPFH结构特征,对相邻帧点云进行初始粗配准,并进一步采用迭代最近点算法(ICP)实现相邻视角下的精确配准,最后使用闭环检测优化模块消除累积误差,得到目标物体的完整点云模型。在得到优化后的全局位姿后,为了进一步提升模型精度和重建质量,本文基于TSDF模型实现三维稠密模型的构建以及更新。并利用掩膜信息实现剔除动态物体的相机位姿解算,进而解算出物体的运动信息。最终完成基于动态物体场景下的三维重构和姿态估计。最后,为了验证重建系统的可靠性,将本文使用的算法与其他三维重建与位姿估计算法进行比较,同时利用旋转平台和结构光相机对本文提出的算法进行验证,给出的实验结果也验证了本文提出的算法的有效性和可行性。