论文部分内容阅读
视频编码技术是有关视频数字压缩的核心技术,是解决海量数据存储、传输及服务的基础问题,对多媒体技术及相关产业的发展至关重要.
视频编码控制优化是指在信道带宽的约束条件下,通过控制各种编码控制参数,尽可能地减少图像编码的信息损失,以实现较高质量的图像解码效果.本文对其中的关键技术,即是码率控制技术和率失真优化技术进行了深入研究,并取得如下研究成果:1.先进码率控制技术码率控制技术是视频编码控制的关键技术之一,其主要任务是通过量化参数控制在总码流中占主体部分的残差图像压缩码率,以满足信道带宽对视频压缩码流大小的客观限制条件.一般通过两步来实现码率控制的作用:首先把带宽资源有效地分配到各个图像单位上;然后计算量化参数,以使实际压缩码率和目标比特数相一致.上述步骤的计算有效性,关键在于能否建立精确的率失真模型.
目前,视频编码控制技术采用了基于量化参数的Lagrange率失真优化技术 (QP-Based RDO),它要求在残差图像率失真关系未知的情况下,利用码率控制技术预先计算量化参数,这是一个典型的"鸡和蛋"悖论问题.针对该问题,本文提出了编码特性预测机制,利用广泛存在于视频数据及编码处理中的时-空域相关性,改进线性回归技术,有效地提高了率失真建模的精确性.进一步,建立了基于预测技术的各种率失真模型,包括:线性MAD模型、线性码率模型、改进的MPEG-4Q2码率模型、控制头信息码率模型以及线性图像失真模型.
为了获得较高的编码效率,本文按照率失真优化的原则在图像单位之间进行比特分配,即是在满足总码率不超过通信带宽的限制条件下,选择合适的量化参数,以使图像失真最小.为此,本文在上述率失真模型的基础上,结合Lagrange优化技术,经过数学推导,得到两种率失真优化的比特分配方案,并进一步实现了相应的码率控制算法:线性码率模型算法和二次码率模型算法.
大量的实验表明:线性码率模型算法和二次码率模型算法的编码效率相当,而前者的码率控制精度稍高.和H.264/AVC标准所采用的码率控制算法JVTGO12相比,本文所提出的两种码率控制算法都具有明显的优势:在获得更高的编码效率的同时,显著地提高了码率控制的精度;而且,计算复杂度和JVT-G012相当,所付出代价仅仅是缓存数量略微增加.
这些优势的取得主要归结于两个主要因素:其一、利用时-空域相关性提高了率失真模型的精确性;其二、首次针对QP-Based RDO实现了率失真优化的比特分配.2.自适应率失真优化技术由于QP-Based RDO方法对量化参数存在严重的依赖性,它存在以下缺陷:一,优化计算时没有考虑信源率失真特性,不具备自适应性,编码效率还存在提升空间;二,在预测编码之前获得量化参数,使得码率控制算法的设计非常困难.鉴于此,本文另辟蹊径,提出了一种新颖的率失真优化方法(ADAPT-RDO),能够根据实际编码统计信息自适应地调整模型参数.
首先,在大规模实验的基础上,本文发现QP-Based RDO的Lagrange乘子与实际编码统计信息平均码率、平均失真之间存在线性函数关系.进一步,可以通过率失真理论对其进行理论验证.然后,利用数据统计实验,发现了MPEG-4 Q2码率模型中二次项系数关于残差图像方差的数值函数关系,并可采用分段函数对其进行拟和.经过上述推导,可以获得一个与量化参数无关的,而且能够根据实际编码信息自行调整的率失真优化代价函数乘子计算方式.
大量的实验表明,和QP-Based RDO相比,新的率失真优化技术具有稍高的编码效率.而且,由于它的计算不需要引入量化参数,从而在根本上消弭了"鸡和蛋"悖论问题,为实现高效的、精确的码率控制提供了新的途径.