论文部分内容阅读
信息技术的快速发展促进了信息量的爆炸式增长。信息的表现形式也由基本的文字、广播,发展到数字视频,海量社交媒体等。在这些信息形式中,数字视频因其为用户提供生动直观的体验而受到大规模应用。据估算,数字视频占据了现有通信网络的70%的网络流量。数字视频可以简单的划分为二维(2D)视频和三维(3D)视频两大类。2D视频由时间上连续的色度图像组成;进一步,3D视频由在不同空间角度获得的2D视频及其对应的深度信息组成。数字视频所需的信息量巨大。对于一幅分辨率为1920×1080,帧率为25帧/秒的2D视频而言,每秒所需传输或存储的数据量是414M比特,而对于3D视频而言,其数据量更是2D视频的数倍。因此,数字视频面临的最重大挑战是如何利用有限的网络带宽使数字视频能够高质量地传输到终端用户。为降低数字视频的数据量,国际标准化组织,ISO/MPEG、ITU/VCEG已经指定多套视频压缩标准,比如,MPEG-x系列,H.26x系列。在此基础上,MPEG和VCEG又联合制定了H.264/AVC视频编解码标准。H.264/AVC标准在压缩效率上与已有标准相比有大幅度提升,但伴随着较高的算法计算复杂度。国际标准化组织正在制定新一代高性能视频编码标准(HEVC),重点在提高视频编码性能及三维立体视频编码效率方面。在各种视频编码标准中,帧内编码技术都是不可或缺的。H.264/AVC的帧内预测模块提供多种模式选择方法和块大小种类,保证了编码的高压缩性能,但同时令编码具有较高复杂度。因此,研究帧内预测性能的提升是该标准研究的重要内容。本文分别针对3D视频中的色度图像和深度图像,提出了两种帧内编码方法。针对色度图,提出了基于灰建模的帧内预测技术;针对深度图,提出了一种基于平面模型的帧内预测方法。本文的主要研究内容和成果如下:1.基于灰模型的帧内预测技术灰系统理论用于解决少数据,小样本,信息不完全的不确定性问题,H.264的帧内预测数据符合这一特点,在本文中,提出了一种基于灰模型的帧内预测方法。在一定条件下,多种预测模式可以获得相近的预测值。将这些相近的预测值作为输入数据,并通过灰模型预测得到最终的预测值。省去率失真优化过程,以及编码模式的信息比特,降低了编码复杂度以及编码的比特数。实验结果表明,与H.264/AVC帧内预测方法相比较,在保证相同视频质量的前提下,提出的方法可以节省平均2.994%的编码比特率,帧内编码复杂度可以降低39.28%。2.应用平面模型帧内预测技术的深度图编码方法深度图和色度图在纹理性质上具有不同特点,用现有的H.264/AVC视频编码技术进行编码时,未考虑到深度图性质。基于对深度图性质的分析和预测模式的统计,本文提出一种应用平面模型帧内预测技术的深度图编码方法。平面模型的参数通过与当前被编码块邻近的上部和左侧像素的灰度及其对应的坐标值计算;利用获得的平面模型参数和当前被编码块的位置坐标,进一步预测当前编码块的灰度值。实验结果表明,与H.264/AVC帧内预测方法比较,在保证相同视频质量的前提下,提出的方法可以最大节省13.14%和平均6.35%的编码比特率。在H.264/AVC的帧内预测模块,应用本文提出的两种改进方法,通过实验平台验证,对2D视频的色度图和3D视频的深度图进行编码时,在计算复杂度上均有所降低,并改善了H.264/AVC的编码性能。