论文部分内容阅读
在视频编码标准中,码率控制技术(Rate Control)一直发挥着重要的作用。无论是过去的H.264/SVC(Scalable Video Coding),当前的H.265/SHVC(Scalable High efficiency Video Coding),还是以后的H.266,码率控制始终是每一代编码标准的核心部分。视频编码需要进行码率控制是因为硬件设备的性能是有限的,使得信息传输速率无法无限制地提升。编码端只能在有限的目标码率下,尽可能多地传输有用信息;当图像失真情况一致时,尽可能降低传输的码率。但是不论图像质量如何优化,视频编码的码率和失真的关系都必须符合率失真定律,即在码率一定的情况下,视频编码后的重建视频的最小失真是一定的。率失真定律是理想情况下视频编码的理论依据,在实际编码的情况下,是不可能实现的,只能对实验结果进行优化。一直以来,研究者们都在对视频编码的码率控制优化算法进行研究,并对不同的视频编码标准,提出了各种优化算法。本论文对可伸缩视频编码标准中存在的一些问题进行研究,提出了一系列算法进行优化,主要内容为:在SHVC码率控制编码的过程中,存在着实际编码的码率与目标码率不一致的问题,这也是本论文需要处理的问题。首先,通过分析CTU(Coding Tree Unit)级图像编码的码率和失真之间的关系,建立一种适用于CTU级目标比特分配的双曲线码率-失真(Rate-Distortion,R-D)模型,并利用传统求解方法对码率控制模型的约束问题进行求解,从而实现对CTU级SHVC码率控制算法的优化。对于码率控制约束性问题的求解方法,本论文采用递归泰勒展开式将其转化为非约束的求解方法,并利用盛金公式进行求解。在SHVC帧内编码模式下,当编码器对视频第一帧图像或者对场景变换图像进行码率控制编码时,编码效果不够理想。其原因在于:在没有先验信息的条件下,编码器对码率控制编码参数的预测不够准确。而深度学习方法具有对图像进行特征提取的优点,本论文将利用该优点对当前编码图像的码率控制编码参数和目标比特分配权重进行预测。深度学习数据集的构建需要对2300张不同的图像进行编码,并提取280000个训练样本。同时,对样本对应的编码参数进行数据拟合获得训练样本的标签。层间信息是SHVC视频编码标准的一大特点,层间信息的利用可以提高编码器对增强层图像的编码效率。但是在SHVC视频编码标准的码率控制过程中,存在着基本层的编码信息没有应用到增强层编码中的问题。本论文将基本层编码得到的失真进行提取,并作为层间信息对增强层目标比特分配过程进行调整。同时,对基本层采用基于深度学习的码率控制算法。本论文实验的对比是在利用层间信息方法的基础上,将是否加入深度学习方法的码率控制优化算法进行对比。