论文部分内容阅读
三维视频能为观众提供更生动、真实的观感,所以受到人们广泛的关注和研究。因为三维视频的原始数据量相当巨大(其主要采用的数据格式为多视点加深度),难以在目前的网络中进行传输,所以如何对其原始数据进行压缩,使其既能适应当前的网络传输负荷量,又能保证三维视频最终的观感是目前艰巨而具有挑战性的任务。因此高效的三维视频编码技术就凸显的十分重要。目前,运动图像专家组织(MPEG)已经成立了三维视频编码特别小组对其进行深入研究。同时,有大量文献关注到该领域。在此背景下,本文重点研究三维视频的编码的关键技术,主要研究内容及成果如下:1.针对三维视频编码复杂度较高的问题,本论文提出一种快速深度图像帧内编码方法。该方法基于视频图像与深度图像的相关性,利用视频图像的最优帧内预测模式信息优化深度图像帧内编码预测模式的选择范围,减少率失真代价函数的计算量,从而降低深度图像帧内编码复杂度。实验结果表明,提出的方法较深度图像独立编码方法能有效地缩短深度图像编码时间,在保证合成虚拟视图质量的条件下,深度图像帧内编码时间平均减少37.16%。2.为了进一步提高深度图编码质量和三维视频虚拟合成质量,本文提出基于编码误差纠正的深度图帧内编码方法。该方法首先根据深度图的特性将深度图划分为平坦区域和边缘区域,并分别分析这两大区域所存在的误差扩散;其次,引入虚拟视图合成理论,对深度图编码误差扩散与合成误差的关系进行定性分析,在此基础上最终提出基于像素修正的抑制误差扩散的深度图帧内编码算法。该算法基于深度图平坦区域和边缘区域的误差扩散特性,在宏块的率失真优化计算中,利用修正值修正易引起误差扩散的块或子块,降低后续大量受误差扩散影响的块或子块的率失真代价函数。实验结果表明,提出的方法能够较好地抑制深度图的帧内编码误差扩散,并有效地提高三维视频虚拟合成质量。3.为了降低虚拟视点合成误差,提高深度视频的编码效率和三维视频合成质量,本论文提出一种新的纹理视频和深度图编码比特分配方法。该方法在比特分配中引入拉格朗日算子参量,从而在限制比特下进一步降低虚拟合成误差。本论文首先依据统计实验并采用最小二乘拟合的方法对纹理视频和深度图分别建立以拉格朗日算子为参数的编码误差模型和编码比特模型。然后利用编码误差和虚拟合成误差的相关性进一步推导出基于拉格朗日算子的虚拟合成误差的模型.最后结合所推导的模型建立虚拟合成误差最小化目标函数,利用无约束优化方法求解最优的纹理视频和深度图编码拉格朗日算子,并依据此算子进行比特分配。实验结果证明,与固定比特算法和全搜索量化步长算法相比,提出的算法在不同的编码条件下使合成视频质量平均提高0.25dB和0.68dB。且该算法得到的编码总比特与目标比特最为接近,平均误差仅为0.45%.4.为了提高纹理视频或虚拟视频在播放端的RGB域的重建质量,降低色度采样所引入的视频混叠、边缘模糊和其它伪影。本论文提出两种纹理视频的色度分量下/上采样的方法。第一种方法为基于频率域的色度下/上采样方法,该方法利用频域采样代替空间采样,因为它的频域特性更接近于理想的低通滤波器,所以能保留更多的原始色度分量信息,从而更好地抑制混叠。实验结果表明该采样方法能够有效地提高RGB域的视频质量,与MPEG-4滤波器相比,视频质量平均提高0.21dB。第二种方法为基于维纳滤波器的色度分量下/上采样方法,该方法在数学分析的基础上首先对采样数据的随机特性进行分析,并证明色度采样和编码所引入的误差近似为宽平稳随机噪声,进而提出利用二维维纳滤波器来抑制这些误差,以此来提高重建的视频在RGB域的质量。客观实验结果表明与双线性和inter-color算法相比,该算法的视频质量平均分别提高0.42dB和0.30dB。同时,主观实验结果证明该方法的重建视频能够更好的接近原始视频。