论文部分内容阅读
三维立体视频系统作为最近出现的一种能够增强视频观赏体验的新兴媒体介质,成为视频应用的重点。其中,立体匹配是3D视频系统研究中的关键问题,通过像点获取对应点深度信息,实现三维立体再现的重要途径。带通相位信息可以反映图像本身结构的位置信息,对景物具有更强、更全面的解释能力。基于相位的立体匹配是立体视频系统研究中的一个重要方向。本论文的主要内容为对当今基于相位信息的立体匹配的研究总结以及算法的改进。基于相位的立体匹配以傅立叶变换的平移不变性为依据,利用复数的带通时频滤波器,提取图像不同频段的相位响应为其本质特征。首先,本文选择具有平移不变性的双树复小波作为提取多个频段相位信息的工具。基于多分辨率相位信息的由粗到精的匹配模式,针对单一通道,提出将视差计算归结为一种求解匹配程度方程极大值的形式,隐式地抑制了相位匹配中最常见的两个问题——相位奇异与相位卷绕,我们将这种方法称作“BestMatch”匹配方法。BestMatch匹配可以基本反映立体图像对之间的视差信息,但对于边缘区域,以及纹理缺乏区域,则需要进一步的修正与改善。由于单纯基于相位的匹配方法无法取得全局优化的视差结果,而且存在图像的色彩平面往往包含在同一视差平面里的假设,因此,我们将匹配问题转化为在视差空间中求解像素深度坐标的问题,通过引入了左右一致性检测,以及图像彩色分割算法和平面拟合算法,提出了一个完整的一维立体匹配框架,对BestMatch算法中得到的初始视差图进行判断、检测、填补、修正。大大改善了边缘区域与缺乏纹理区域的匹配精度,与近年其他的相位匹配算法结果相比较,也有比较好的提升。在视差图边缘区域,克服了基于相位的匹配方法中通常出现的毛刺、不清晰等问题。最后,我们根据四元数以及四元小波的构造准则,利用双树复小波的张量积构造了四元小波,可以用以提取像对的四元相位,进而求取二维视差。我们给出了一个二维相位匹配的框架,来计算未校正图像对的稀疏视差场。实验结果证明,此方法可以比较准确的估计平移、旋转以及运动图像对之间的稀疏视差,在自由视立体匹配以及运动估计等方面均可以加以运用。