论文部分内容阅读
3D产业发展迅速,学术界和普通大众都对3D显示产生了越来越多的兴趣。但是由于3D视频相对于2D视频制作较为复杂,3D内容的不足已成为3D产业普及的一个瓶颈。而且随着人们对3D视频的兴趣越来越高,许多人希望利用工具将自己的2D视频转换为3D视频已获得更好地观看体验。2D-3D视频转换技术能够将2D视频转换为3D视频,能够极大缓解以上问题问题。2D-3D视频转换技术根据人工参与程度主要分为三类:人工转换,半自动转换和自动转换。人工转换得到的3D视频质量最高,但需要消耗大量的时间和人力成本,难以推广。半自动转换仅需少量人工参与,自动转换不需要人工参与,这两种转换方式使用合适的算法也能得到质量较高的3D视频,所以得到了研究者的关注。在半自动和自动视频转换中,关键帧选取和深度传播是十分重要的步骤,它们决定了最后生成的深度图的质量,进而影响到了生成的3D视频的质量。之前的研究者在这两个过程中提出了一些有效的算法,但是都没有将两者联系起来,即使选取了合适的关键帧,在深度传播时只依据时间顺序进行传播。但是决定图像帧相似与否的并不是时间上的远近,而是距离上的远近。本文提出了基于图像距离的关键帧选取方法及深度传播策略。首先,探讨了图像距离的定义,在不同步骤中,本文使用不同的距离定义,已达到最合适的效果。然后,在关键帧选取中使用不同的全局特征,HSV颜色直方图和GIST特征作为距离的定义进行K-means聚类,并通过实验进行了对比。接着,在深度传播中,本文提出了两种传播策略,一种是关键帧直接向所有非关键帧进行深度传播,这种方式计算简便,能够节约时间,并得到质量较高的深度图,另一种是基于Prim算法对类内所有帧进行严格排序,保证深度传播的总距离达到最小,使深度传播的误差达到最小,这种方式是深度传播更加准确,误差最小,能够得到质量很高的深度图。通过实验,这两种传播策略与其他方法相比,能够得到更小误差的深度图,证明了本文提出方法的有效性。本文还将在2D-3D视频转换中提出的方法的思想应用到三维重建上,在图像选取和点云去噪两个过程中均使用聚类思想,提高重建效率,提高了重建模型的质量。本文探讨了3D视频的质量评价标准,选取了合适的评价方法对本文中的方法进行了实验。评价结果验证了本文方法的优势,说明本文方法能够提高2D-3D视频转换效率,得到更高质量的3D视频。