论文部分内容阅读
人类观察客观世界依靠双眼进行,由于客观的世界是三维立体的,所以人眼得到的视觉信息也是三维立体的。三维立体的信息包含客观事物的深度信息,依靠这些深度信息可以判别客观事物在现实场景中的距离远近和深浅。视觉信息采集仪器在捕捉场景图像信息时,只能捕捉到二维场景信息,造成图像的深度信息即第三维信息丢失。如何恢复场景的深度信息成为恢复真实场景信息的关键。在对二维图像信息的不断研究过程中,产生了计算机视觉技术,并且由于计算机视觉技术强大的图像图形分析能力,在现代科技中有广泛的应用。
经过几十年的发展,双目立体视觉技术由于与人类视觉系统的相似度最大,并且应用范围最广成为计算机视觉技术的代表。在双目立体视觉系统处理过程中,首先需要从不同的视角获得场景的二维图像,视角可以是两个或多个,将获得的二维图像对或二维图像组通过立体匹配算法求出不同图像匹配点之间的视差,再将视差通过几何三角测量关系求出对应点的深度值,从而得到场景的深度图。在双目立体视觉处理过程中,如何得到不同图像之间的匹配点成为获取深度值的重点。
本文首先对计算机视觉理论、双目立体视觉理论、深度图像获取技术进行了分析和讨论,对计算机视觉理论和双目立体视觉理论的各种技术应用进行了总结,在深入理解双目立体视觉几何结构的基础上,对双目立体成像的过程进行了分析,重点对双目立体视觉过程中立体匹配的两种主要技术--基于特征的立体匹配技术和基于区域的立体匹配技术进行了研究,结合当今立体匹配新兴技术,对两类立体匹配算法进行了仿真,并将仿真结果进行了比较。
最后,本文将区域匹配和特征匹配两种优势结合,提出一种基于特征约束的区域匹配方法。首先对输入图像进行特征匹配检测是否满足单一性约束、单调性约束及相对位置约束,若满足条件则对视差图进行中值滤波,进入区域匹配过程,在区域匹配过程中对所求各点视差计算其与相邻点的视差梯度,根据视差梯度范围选取相应的匹配窗口大小寻找匹配点求出视差,再对视差图进行中值滤波得到较好效果的视差图,利用三角测量法提取深度信息。从视差图对比结果可以看出,本文提出的改进算法不仅能够有效地保存视觉场景的连续信息,而且能够突出场景的几何轮廓信息,形成较为完整的视差图。