论文部分内容阅读
作为一个多学科交叉的领域,计算机视觉的理论研究和实际应用都取得了飞速的发展。尤其是近年来,图像科学的发展和计算机信息处理能力的增强,为计算机视觉的研究和应用提供了良好的条件。因此,对计算机视觉的进一步研究,具有重要的理论意义和实用价值。计算机视觉的主要研究内容是由多幅二维的平面图像恢复出被摄物体的三维空间信息,而其中基于两幅图像的视觉技术则是一个研究热点。计算机视觉的基本原理是模仿人眼与人类视觉的立体感知过程,从两个视点观察同一景物,以获取不同视角下的感知图像,通过三角测量原理计算图像像素间的位置偏差,以获取景物的三维信息。一个完整的计算机视觉系统通常可分为图像获取、摄像机标定、图像预处理、特征提取、立体匹配和深度确定等六大部分。重点对立体匹配过程进行了详细分析和算法实现。开发了图像获取系统,实现了图像数据的直接内存访问。同时,研究了摄像机标定技术,利用成像过程中的径向约束(RAC)分解摄像机参数,使得求解线性方程组即可得到全部的摄像机参数,避免非线性优化搜索。图像预处理包括图像噪声的平滑、对比度的增强和边缘检测等。在分析研究各种图像预处理算法的基础上,用VC++实现了这些算法。在立体匹配方面,以边缘点为匹配基元,改进了双阈值判断的分阶段立体匹配方法。通过边缘检测、相似性检验和兼容性检验完成了匹配的全过程,并采用双向匹配,以获得更多的最佳匹配点,这样既缩小了匹配搜索空间,又保证了匹配的可靠性。并对得到的离散数据进行了三维重建,恢复深度信息,最终在OpenGL中实现了物体的三维显示。本文针对计算机视觉系统中的各项关键技术,包括图像获取、摄像机标定、图像预处理、特征点提取、立体匹配、三维坐标计算等进行了方法研究和软件仿真实验,验证了所采用方法的正确性和可行性。为开发构建一个完整的计算机视觉系统结构奠定了基础。