论文部分内容阅读
分布式视频编码(Distributed Video Coding)基于Slepian-Wolf理论和Wyner-Ziv理论,对两个或多个独立同分布的信源进行独立编码,然后由单一解码器利用信源之间的相关性对所有编码的信源进行联合解码。它与传统的视频编码技术的区别在于:传统的技术标准通常都用于在编码端充分挖掘视频信号的冗余信息,因此编码复杂度一般是解码复杂度的5~10倍,适合于对视频信号一次编码、多次解码的场合(如视频广播、视频点播、视频光盘存储等);而分布式视频编码具有编码器复杂度低、编码端耗电量低、容错性好等特点,适合于一些计算能力、内存容量、耗电量都受限的无线视频终端(如无线视频监控系统、视频传感器网络等)。分布式多视点视频编码则可以看作是分布式单视点视频编码的一个延伸。和分布式单视点视频编码不同的是,分布式多视点视频编码除了可以从时间方向上获得时间边信息外,还可以从视间方向上得到视间边信息。尽管在通常情况下,时间边信息的质量优于视间边信息;但是,若从局部区域看,在一些运动剧烈的区域,时间边信息通过运动估计、运动补偿的方法往往会估计错误,导致边信息质量下降;而这些区域的视间边信息相对比较平滑,可能优于时间边信息。边信息融合的任务就是要找到同一区域位置下更优的边信息,并将其作为该区域的最终边信息。本文针对单视点分布式视频编码系统解码端的Wyner-Ziv帧重构模块提出了基于比特平面预测并修改重构概率密度函数的方案。普通分布式视频编码在解码端用插值的方法构造边信息时会丢失部分信息,本文从用于插值边信息的前后两个相邻视频帧中提取特征并由此预测当前重构WZ帧的下一个比特值,并进一步利用预测得到的比特值修改重构概率密度函数。该方案结果优于现有的单一重构概率密度函数性能,使得能在传输较少比特平面时提高重构Wyner-Ziv帧的PSNR和主观质量。此外,对于分布式多视点视频编码,本文则提出了基于条件随机场模型的时间边信息、视间边信息融合方案。普通的边信息融合方案寻找时间边信息中突变的运动矢量,并将相应的视频块用视间边信息替代。这一方法是以块为单元的,容易在融合的边信息中产生不平滑的块边缘。本文通过为条件随机场定义特征函数,训练出每个格点(像素)位置上重构WZ帧(前一帧)、时间边信息、视间边信息三者之间的权重关系,根据训练出的权重系数,进一步推断当前标签,从而得到最终边信息。该方法将视频帧像素间的空间相关性引入到条件随机场模型中,能够有效地识别出时间边信息中运动突变的区域,并将这些运动突变区域用视间边信息中的相应区域代替。实验结果显示,该融合方案在率失真性能方面要优于现有的边信息融合方案。