论文部分内容阅读
随着电影《阿凡达》的热映,3D电视逐渐走进人们的生活,人们希望在家就能进行3D体验。丰富的3D片源是3D电视推广成功的一个重要因素。但现阶段,3D内容制作成本昂贵、耗时长,使得3D内容匮乏。而现有丰富的2D视频,2D转3D可有效缓解此状况。深度估计是2D转3D技术中的关键技术之一,通过深度估计得到的深度图的精确与否直接影响合成的3D影像的好坏;此外,视觉舒适度改善也是2D转3D的关键技术,它能使人们观看立体影像时降低视觉疲劳。本论文研究的目的,就是通过对现有的2D转3D关键技术进行研究,提出更好的深度估计和视觉舒适度改善算法,为它们在2D转3D的应用提供理论和技术支撑。论文首先简要介绍了2D转3D的基本原理;然后研究了2D转3D系统的关键技术之一:深度估计。在深度估计算法中,重点研究了基于图像清晰度差异的深度估计算法、基于相对高度的深度估计算法以及基于运动目标分割的深度估计算法;最后研究了基于深度调节的视觉舒适度改善算法。论文的主要研究成果包括:①由于摄像机通常聚焦在前景且聚焦对象比较清晰,我们可以利用此特点来估计深度。因此提出了基于图像清晰度的深度估计算法。与其他深度估计算法相比,该算法复杂度低,便于硬件实现。②提出了一种基于相对高度的深度估计改进算法。改进后的算法简化了约束公式,同时新增“右近左远”及“左近右远”两个模板,并用联合双边滤波替换了原算法的滤波,使深度图更平滑。为改善人们感兴趣的物体的深度估计,算法引入了视觉注意。实验结果表明该算法能得到比较精确的深度图,适用于室外场景的深度估计。③提出了一种基于对称帧间差分法和联合双边滤波相结合的视频分割算法,并将它用于改进的基于相对高度的深度估计算法中。视频分割算法首先对连续三帧图像采用对称差分法得到运动区域(差分图),然后采用30×30滤波模板以当前帧为引导图对差分图进行联合双边滤波以填充运动目标的空洞。接下来分别对滤波后的差分图和当前帧灰度图进行Canny边缘检测,结合二者的检测结果得到更为完整的边缘,并利用此边缘对滤波后的差分图进行后处理,从而分割出较为精确的运动目标。最后将得到的运动目标应用到改进的基于相对高度的深度估计算法中。④提出了一种基于深度调节的视觉舒适度改善的方法。该方法首先提出适用于DIBR的三维图像变换方程。因使用shift-sensor摄像机设置,三维图像变换后的立体图像对只包含水平传感视差。其次,深入分析了3D电视显示系统的几何原理,将感知深度表示成水平屏幕视差的函数。最后,给出水平传感视差和水平屏幕视差之间的关系,由此给出了一种适用于DIBR的深度调节的方法。在DIBR处理过程中,该方法通过改变摄像机空间中的参数值来控制立体图像对的水平传感视差,从而最终调节立体图像对显示时的感知深度。实验的主观评估显示,此深度调节算法可以产生人们所期望的不同感知深度的立体图像。本论文力求在研究方法与思路上有所突破,其研究成果将为2D转3D技术在3D电视中的应用提供具有实用价值的新方法。