论文部分内容阅读
随着人类对立体图像技术及其应用研究的不断深入,多视点图像得到了极大的发展。多视点图像赋予计算机以人类的视觉认知功能,使计算机具有通过二维图像认知周围环境信息的能力。作为多视点图像处理的重要技术之一,摄像机标定也得到了迅速地发展。摄像机标定是三维图像重建和摄像机跟踪等一些技术的基础,因此对摄像机标定的研究具有重要的意义。摄像机标定方法主要有三类,基于标定物的标定方法、基于主动视觉的标定方法和摄像机自标定方法。其中,基于标定物的方法可以获得较高的精度,但标定过程费时费力,不适用于在线标定和不可能使用标定块的场合。在这类方法中,张正友的摄像机标定方法是公认的经典摄像机标定方法,常被用来作为摄像机标定的标准。基于主动视觉的标定方法的优点是算法简单,往往能获得线性解,但是当摄像机运动方式未知时,无法发挥其作用。鉴于以上缺点,本文主要研究摄像机自标定方法。本文首先研究了摄像机标定的重要组成部分之一,立体匹配技术。该技术分为两类,即基于块的立体匹配技术和基于特征的立体匹配技术,其中基于块的立体匹配技术方法简单,速度快。而基于特征的立体匹配技术相对比较复杂、耗时,但是匹配精度比基于块的立体匹配技术高。通过比较,本文选择基于特征的立体匹配技术作为摄像机标定的立体匹配部分。非线性拟合技术是摄像机标定的另一个重要组成部分。本文研究了两种非线性拟合技术,遗传算法和LM算法。其中,遗传算法具有较强的全局搜索能力,无需给定初值,但局部搜索能力较弱,且要求约束函数必须收敛于最小误差;LM算法具有高斯-牛顿法的局部快速收敛特性,但需要给定的初值接近最优解。本文提出了一种将遗传算法和LM算法相结合的方法,并将其用于估计摄像机的内参数。该方法结合了遗传算法的全局搜索特性和LM算法的局部收敛特性。在以上分析与研究的基础上,本文提出了一种基于单一场景多视点图像的摄像机自标定方法。该方法对同一场景的多视点图像依次进行特征匹配、建立匹配特征点集、选取最适合标定的三帧图像,最后将遗传算法与LM算法相结合估计摄像机的内外参数。实验结果证明,本文方法标定精度较高,与单纯使用遗传算法相比,本文方法得到的结果更接近张正友方法得到的结果。而且本文方法具有一般摄像机自标定方法的优点,即不需要借助于任何标定物,也不需要摄像机做特殊运动,所以与张正友方法以及其它一些传统的标定方法相比,本文方法具有较高的理论和实用价值。