论文部分内容阅读
多视点视频(Multi-view Video)是能够提供立体感和交互操作功能的新型视频系统,它能够提供场景对象在不同观察角度下的视频图像信息,并可根据使用者的需求自由选择和操作视听对象。具有立体感和交互操作功能的多视点视频是现代视频技术的新兴研究方向,将成为未来视频技术的重要组成部分。但是,多视点视频和单通道视频相比,数据量成倍增加,必须采用更高效的编码压缩算法,才能对多视点视频数据进行存储和传输。在多视点视频中,除了各个视频流内具有很强的空间和时间相关性,各视点之间也具有一定的交叉相关性,如何有效地利用这些相关性是提高多视点视频编码效率的关键。为提高多视点视频的压缩效率,本文主要在多视点视频编码的运动与视差矢量预测、视差预测结构以及与分级B帧相结合的编码方案等方面进行了研究。
本文首先分析了基于H.264标准的数字视频编码算法,重点研究了运动补偿和运动估计的算法实现和改进原理,在此基础上,结合运动估计的中心偏置特性,提出一种运动矢量场自适应搜索算法,使运动估计匹配准确率和搜索速度得到有效提高。在深入研究运动估计算法的基础上,本文分析了运动估计和视差估计的数据特性和算法特点,论述了运动估计和视差估计在算法思想上的相似性与差异性,探讨了利用多视点数据流的空域相关性与时域相关性进一步压缩数据的改进途径,提出了一种基于视差矢量特性的快速视差估计算法,充分利用了空间数据信息的相似性,有效消除了空域数据冗余。
本文系统地研究了多视点视频系统的实现原理,考察了现有的典型多视点视频系统框架,分析了多视点视频系统的实现原理,研究了目前主流的多视点视频编码实现方法,在视差估计编码思想的基础上,深入分析了分级B帧的预测结构和编码优势,探讨了将分级B帧引入多视点视频编码方案的改进空间,并提出结合分级B帧的多视点视频编码方案,经实验验证,达到了提高多视点视频压缩效率的目的。