论文部分内容阅读
随着4K、HDR等高清视频技术的发展,消费者对更高分辨率、更具沉浸感视频内容的需求持续增加,已迫使视频行业不断研发更加高效的视频编码(压缩)技术。如何利用有限的带宽资源,编码出质量更高的视频流一直以来都是视频编码优化领域所研究的重点。码率控制和率失真优化作为视频编码传输中的关键技术,在实际视频多媒体应用中起着至关重要的作用。在编码视频序列时,码率控制和率失真优化模块通过选择合适的编码参数或编码模式,可以使编码后的输出码流满足给定的带宽要求,同时使编码失真尽可能小。为了使得在码率控制以及编码模式选择过程中码率的分配更加合理,更加符合人眼视觉特性,也就是使编码视频流的主观视觉质量更高,将一些关键有效的人眼视觉特性以及图像内容特征考虑进来,可以为优化码率分配、选择最佳编码模式提供有价值的参考和一些新的改进思路,这也是目前视频编码优化领域的一个研究热点。针对现有码率控制算法方案没有充分考虑人眼视觉特性的不足,本文提出了一种基于视觉掩蔽效应的码率控制优化方案。该方案不仅考虑了原有方案根据编码复杂度进行码率分配的方式,还将人眼视觉特性考虑进来,并根据图像区域的纹理复杂度和运动复杂度提出了时空域内容感知因子模型。由于该内容感知因子能够有效刻画图像区域的视觉重要性或视觉失真敏感度,因此可以用来为同一帧内各个编码单元的码率分配提供指导,使得更多的码率分配到视觉上更重要的区域。通过以上这些改进,能够进一步提高解码视频的视觉感知效果,即同等码率下主观视觉质量更高。实验结果表明,在所有测试序列上基于MOSp指标的平均BD-Rate增益可达4.49%。本文后续部分章节具体介绍了该优化方案的实现细节,并对相应的实验结果进行了分析与讨论。针对现有率失真优化算法方案没有充分考虑人眼视觉特性的不足,本文提出了一种基于视觉感知特性的率失真优化方案。在该方案中,首先基于视觉模式复杂度、对比度掩蔽、亮度适应性以及自由能原理等视觉特性形成了混合JND模型。为了将此模型应用到率失真优化过程中,本文进一步推导得到了依赖图像区域视觉失真敏感度的拉格朗日乘子调整系数,用以自适应调整率失真优化过程中的拉格朗日乘子,从而在保持主观质量基本不变的情况下有效降低编码过程消耗的码率。实验结果表明,采用该方案后在所有测试序列上的平均码率节省可达13.1%。本文后续部分章节具体介绍了该优化方案的实现细节,并对相应的实验结果进行了分析与讨论。