论文部分内容阅读
为了满足日益增长的应用需求,近20年来,国际电信联盟电信组(International Telecommunication Union-Telecommunication, ITU-T)、国际标准化组织(International Organization for Standardization, ISO)陆续颁布了一系列视频编码标准,例如H.261、MPEG-1、MPEG-2、H.264等。其中,目前最新的编码标准H.264以其高效的压缩性能和良好的网络亲合力获得了巨大的成功,并逐渐在各个应用领域中占据主导地位。本文研究H.264的关键技术,包括码率控制、模式选择、多参考帧运动估计(Multiple Reference Frames Motion Estimation, MRF-ME)几个方面。码率控制对于视频编码标准的应用有着重要意义,其目的是在最大限度保证视频编码质量的前提下,使得输出的编码数据流能够满足传输、存储条件限制。相对以往编码标准,H.264编码器的复杂度更高,其码率控制更具挑战性。本文对H.264码率控制算法进行研究,针对联合视频专家组(Joint Video Team, JVT)推荐的H.264码率控制参考算法中的缺陷,具体提出了以下优化算法:提出了一种初始QP选择算法。综合考虑带宽资源与编码视频的复杂度,本文通过对大量实验结果进行拟合,得到了在特定目标码率下不同复杂度视频的最佳初始QP计算公式。该算法复杂度低、应用简单。实验证明,针对不同的测试序列,该算法都具有良好的性能。(2)帧内码率-量化(Rate-Quantization, R-Q)模型及其应用首先提出了一种帧内R-Q模型,该模型准确度高、实用性强;其次,将该帧内R-Q模型应用到I帧码率控制中,并提出了相应的I帧码率分配算法;此外,由于在突变型场景切换中大部分宏块(Macroblocks, MB)采用帧内编码模式,将该帧内R-Q模型应用到场景切换的情况中,提出了相应的场景切换码率分配算法,极大地减小了场景切换所导致的码率及PSNR波动。对于P帧的码率控制,JVT的参考算法具有平均绝对误差(Mean Absolute Difference, MAD)预测不准确、二次R-Q模型更新不准确的缺点。针对这些缺陷,提出了基于Sobel算子的码率控制算法。通过采用Sobel算子,提高了MAD值预测和R-Q模型更新的准确度。实验证明,该算法可以获得较高的峰值信噪比(Peak Signal to Noise Ratio, PSNR)增益,码率控制结果更为准确。分层B帧编码结构的引入可以提高编码效率。但是,现有的码率控制算法不能很好地支持这种编码结构,从而导致其编码性能下降。本文提出了一种针对分层B帧的码率控制算法,通过给低层编码帧分配更多的比特来保证整体编码效率。实验证明,该算法的可以获得比同类算法更高的控制精度和更优的编码性能。种类繁多的编码模式是H.264编码标准能够获得较高编码效率的重要原因,但是也导致了H.264的高编码复杂度。为减轻编码端的计算负担,本文提出了帧内快速模式选择算法以及P帧快速模式选择算法:在该算法中,首先通过对当前宏块进行复杂度分析来选择编码模式(Intra4×4 Intra16×16);若最佳编码模式是Intra4×4,则根据相邻已编码块的编码信息简化Intra4×4预测模式选择过程;若最佳编码模式是Intra16×16,则利用当前宏块的复杂度分析结果简化Intra 16×16预测模式的选择过程。实验证明,该算法有效降低了编码端复杂度,且编码性能损失较小。在该算法中,若当前编码宏块时域平稳,则只检测大块编码模式;否则利用宏块间的空域、时域相关性来预测当前宏块编码模式。若最优帧间编码模式代价值满足一定条件,则跳过帧内模式选择过程;否则利用本文所提帧内快速模式选择算法进一步加速P帧模式选择过程。实验证明,在大幅度提高编码速度的同时,该算法导致的编码性能损失很小。一般来说,MRF-ME的应用可以提高运动估计的准确性,从而进一步提高整体编码性能。但是,MRF-ME所带来的高复杂度,限制了这项技术的应用。本文提出了一种快速多参考帧选择算法。该算法的要点是:判断时域平稳性以确定最佳参考帧是否为最邻近参考帧;综合利用空域相关性、不同编码模式间的相关性预测当前块的最佳参考帧;利用当前块在不同参考帧上的运动矢量(Motion Vector, MV)及代价值之间的关系进一步排除不需要检测的参考帧。实验证明,该算法可以极大地节省MRF-ME的时间,并且其码率-失真(Rate-Distortion, R-D)性能与参考帧全检测下的结果很接近。