论文部分内容阅读
随着3D电影放映银幕的增多和3D硬件产品的进一步普及,现有的3D媒体资源已经远远不能满足日益增长的市场需求。为了解决这一问题促进3D产业发展,人们开始尝试将已有的2D媒体资源加工处理,比如说专业拍摄所得的电影和电视剧,或者日常生活中随手拍的平面照片和视频,将其转换成可以在立体终端显示的3D资源,而人们可以借助一些3D辅助设备进行观看本文研究的是一种自动的2D转3D方法,通过对图像场景的相似性的分析,在现有的RGBD数据库中找出与输入图像场景相似度最高的若干幅图像,并在局部特征分析的基础上建立输入图像与匹配图像之间的映射关系。之后,建立概率模型,在已知的深度图基础上对预期输出深度信息进行估计,也就是实现深度图的优化过程,从而得到一幅精确深度图。最后,通过某种相应的专业手段来生成最终的3D图像。本文的具体内容包括:第一,采用一种基于GIST特征匹配的参考图像选取方法,在数据库中寻找与输入图像在场景上相似的匹配图像。为实现对已有信息的更全面的利用,将图像场景分类方法引入深度图获取过程中,通过计算不同图像的GIST特征所获取的GIST向量,来衡量图像在场景上的相似情况,进而找到所需的参考图像。第二,采用基于SIFT流的像素映射算法,使得输入图像与匹配图像的像素之间能有一种更精确的对应,以便完成深度图的赋值与优化。先分别计算输入测试图像与参考图像的SIFT特征。接着,在输入图像与匹配图像的SIFT特征图像之间通过能量函数寻优的方法,可以得到像素匹配所需要的SIFT流矢量,记录像素的映射关系。第三,采用一种基于IRLS的深度估计算法,实现深度优化求解。该算法需要建立一个能量函数,描述输入图像和其期望深度图之间概率关系,其中包括输入图像自身的信息、与匹配图像的像素分布的映射关系、深度图的梯度信息以及均值信息,之后再进行迭代求解,得到期望深度图。最后,利用所得深度结果可以很容易地构建出最终的3D图像。