论文部分内容阅读
深度估计这个领域是计算机视觉中最古老、研究最广泛的课题之一。其应用包括对人的视觉系统建模,机器人导航和操作,以及基于图像的渲染,3D模型建立以及在计算机中生成的影像中混合实景动作。双目立体匹配是深度估计问题中应用最广泛的方法,其原理是从两个行校正后的左右图像中找出匹配的对应点,之后用左、右匹配点的行坐标值相减得到相应的视差值,从而生成深度图。然而由于双目相机在拍摄同一场景时的视点不一致,会出现遮挡、深度不连续等问题。另一种深度估计方法称为散焦测距(depth from defocus,DfD),其原理是根据物体所处位置与摄像机聚焦平面的偏离程度对应在像平面上形成模糊的散焦图像的模糊程度。与立体视觉不同,该方法的中需要的图像是通过改变相机参数而在同一视点获得的。该算法利用图像梯度的空间统计分布特性,建立模糊核半径与深度值之间的函数关系,适用于求解梯度较大区域的深度估计问题。然而由于求解每个像素点处的点扩散函数(Point Spread Function)是一个病态问题(ill-pose problem),因此在实际应用中求解的往往是近似解,因此该方法生成的深度图像精度较低,鲁棒性较差。本文的贡献主要包括两个方面,第一针对传统散焦测距方法进行了改进,设计了一种编码镜头,通过修改常规彩色摄像机的光圈,使得一个颜色通道的有效孔径尺寸小于其它两个色彩的通道孔径;第二针对上述两种传统方法的优缺点,本文提出了一种双目视差法与多频谱变化融合的深度估计方法,解决了融合双目立体视觉与多频谱变化算法的数据采集装置的设计问题,克服了双目立体匹配由于视角的不同引起的遮挡问题,并设计了一种将深度图与图像抠图向结合的算法。其中,深度图为图像抠图提供了确定地前景、背景样本点,图像抠图蕴含的丰富的边界信息弥补了深度图在边界处理上的缺陷,两者相互迭代,实现自动化抠图与增强深度图的效果。最后分别在Middlebury数据集和真实场景中进行了实验,证明了本文提出方法的优越性和可靠性。