论文部分内容阅读
三维重建是计算机视觉和计算机图形学领域的一个重要研究课题,其作为一种数据存储和虚拟现实的技术,可将二维空间恢复为三维空间,在场景建模、医学诊断、视觉导航等科学工程领域以及影视、娱乐、历史研究等文化领域有广泛的应用前景。其中平面场景三维重建越来越受到关注,特别是运用在体育分析领域中,快速且精确地获取三维场景中的数据是该领域的热点之一。本文基于体育领域,以实现场景目标三维定位为目的,对平面场景三维重建的关键技术展开了研究。从未标定的场景中,根据真实场景和平面场景模型间的特征匹配,恢复不同视角下的几何约束关系。具体工作内容包括以下几点:(1)场景重建的预处理过程,包括平面场景及目标检测算法的研究。由于摄像机获取的场景视频流中包含大量的数据信息,为了提高重建的速度及恢复场景中目标的三维信息,文中根据场景的颜色特征和纹理特征,提出了一种结合颜色聚类和图像局部熵值的平面场景检测方法,提取出具有语义信息的平面场景。并基于此,建立场景平面的背景模型得到目标初步检测结果,运用目标的显著性信息补全前景像素,实现平面上多目标的完整检测。(2)三维场景中相机自标定方法的研究。在实际中摄像机往往需要根据需求随时调整角度和焦距,为解决传统的离线标定带来的误差,本文利用平面场景的几何特征实现摄像机的自标定,提出基于全局优化的投影矩阵求解方法。根据自下而上的思想,采用随机采样一致性算法提取平面中的几何特征参数,通过设计顺序关联策略实现标定点的快速匹配。并结合自上而下的参数估计方法,利用平面场景模型的非各向异性排除误匹配点,得到投影矩阵的初解。最后根据参数的反向投影得分和重投影误差,对投影矩阵进行全局优化。(3)实现平面场景的三维重建。为完成相机参数的动态更新及场景序列的重建,本文设计了全局运动参数恢复法,根据相机的运动推导出场景序列间的平面变换矩阵,利用金字塔LK稀疏光流跟踪场景中的特征点,并在RANSAC迭代框架下恢复相机参数。基于相机标定的参数,由投影模型唯一确定目标在真实三维场景中的位置。同时为使目标信息更丰富,利用其颜色特征进行训练,实现目标的识别。结合场景和目标的几何模型、色彩模型,在建模环境下实现场景的多视角可视化,完成二维空间到三维空间的恢复。