论文部分内容阅读
我们获取的大部分的信息是通过视觉得到的,并且视觉感知外界信息具有很高的效率。所以让机器拥有像人类一样的视觉可以让机器更加快速高效的获取外界的信息,机器视觉的发展具有重要的理论意义和实际意义。机器视觉是我们实现人工智能的一个重要环节,机器如果拥有眼睛,就代替人类对实际场景的分析和计算。机器视觉把图片作为信息提取的对象,通过对比与处理得到相应的距离数据,具有测量范围广,测量精度高,测量成本低等优点,其有着广泛的应用前景,对其研究具有重大的理论意义和实际意义。机器视觉的处理最主要的是图像处理,运用图像处理中的图像分割、提高信噪比、特征提取等技术处理摄像头拍摄到的照片。双目视觉是机器视觉的一个分支,双目视觉具有成本低、适用性强等优点,只需要在自然光照的条件下用摄像机拍摄物体图片然后恢复物体的三维信息。双目测距是双目视觉一个重要分支。本文首先对摄像机进行标定获取摄像机的内外参数,然后对图像进行预处理,对下载的和自己构建的数据集的数据进行训练,得到立体匹配的模型,通过使用卷积神经网络(CNN)训练出来的小图像块匹配模型来对左右摄像头拍摄到的两幅图像进行立体匹配,立体匹配包括全局立体匹配和半全局立体匹配,本文使用的是半全局立体匹配,时间上比全局立体匹配快并且准确性也较高。在半全局匹配的时候中我们对匹配代价进行计算,对代价聚合处理,优化视差图像,使用滤波器和插值等方法对视差图细化,最终得到匹配点密集的视差图。经过三维重建,生成三维点云过程以后,可以获得物体的深度信息和距离信息。本文使用CNN结构的是经过反复实验调整过后的GAO-CNN卷积神经网络架构。使用GAO-CNN卷积神经网络训练的模型进行立体匹配之后可以快速的生成的准确的视差图并且测算出物理空间中物体的距离,编写程序使用的是Python语言,同时英伟达显卡的CUDA加速并行处理可以满足我们对测距系统速度的需要,具有较强的适用性。GAO-CNN卷积神经网络训练出来的模型对低纹理的区域比普通的BM算法和SGBM算法获得的视差效果图要好很多。