论文部分内容阅读
摘 要:在H.264视频编码器帧内预测模式下,为确定一个宏块的帧内预测模式,会带来很大的运算复杂度,基于图像差分的帧间预测模式快速选择算法,采用测定图像序列平坦度的思想,能够实现快速帧间模式选择。可以有效减少模式搜索次数并能保证视频编码的质量,从而可大幅度降低编码时间和视频压缩的计算量,有效地减少了帧间模式选择算法运算复杂度,有利于实际应用。
关键词:H.264;图像差分;模式选择;边缘信息;帧间预测
中图分类号:TP391.41 文献标识码:A
Abstract:With the intra-frame prediction mode of H.264 video encoder,determining an intra-prediction mode of a macro block will bring great computational complexity.The paper proposes an efficient fast intra-prediction mode selection algorithm based on image difference.It adopts the idea of determination image sequence’s flatness to achieve fast inter-frame mode selection.This algorithm can reduce the times of search mode effectively and ensure the quality of video encoding,which can greatly decrease the encoding time and the computation of video compression and reduce the computational complexity of the inter-frame mode selection algorithm.It is conducive to real-time application.
Keywords:H.264;image difference;mode selection;edge information;intra-prediction
1 引言(Introduction)
随着移动通信和网络的发展,视频通信成为了移动通信的重要组成部分。视频压缩也制定了诸多标准,H.264/AVC[1]是国际视频编码标准之一,其能有效地提高视频编码效率,并具有良好的网络的适配性,其编码算法可广泛应用视频流媒体服务、数字电视、无线视频通信、IP视频会议和实时视频监控等领域,有着非常广泛的应用前景。
然而H.264/AVC在其良好性能提升的同时,算法的复杂度也大大地增加了,给视频通信带来了困难,不利于实际应用[2]。因此如何在保证帧间预测的编码效率情况下,采用实用有效的算法来提高H.264预测帧的编码速度,成为满足实时视频通信的要求的重要课题。通过分析研究H.264中的帧间模式选择算法,本文提出一种能够进行快速帧间模式预测的基于图像差分的选择算法。通过仿真实验,并与X264的测试结果进行对比,结果表明,图像差分快速算法可以在保证视频编码质量并能有效地减少搜索模式数,从而可大幅度降低编码时间和视频压缩的计算量,可应用于实际的视频通信中。
2 H.264 帧间模式选择算法(Intra-prediction mode
selection algorithm based on H.264)
最新的视频编码标准H.264与以往的编码标准相比具有良好的编码效率,例如,在相同的重建图像质量下,能够比H.263、MPEG4等节约50%左右的码率,这是因为H.264标准引入了如统一的VLC符号编码,高精度、多模式运动估计技术[3]。所谓多模式运动估计[4],就是将一个16×16宏块划分成16×16、16×8、8×16、8×8、8×4、4×8、4×4或者采用SKIP模式进行运动估计,如图1所示。
编码器遍历所有的模式,以公式计算RDO[5](率失真)为判决依据来寻求最佳匹配块,也就是在搜索范围内寻找使得公式达到最小值的参考帧中的宏块。
式中,=为运动矢量,是拉格朗日(Lagrange)乘数因子,是个常数[6],和量化参数QP和待编码块的类型有关,SAD为绝对误差和,s表示原视频信号,c表示解码视频信号,=为预测的运动矢量,R(m-P)为表示运动矢量差值所需的比特数。
多模式运动估计能够极大地提高了编码的效率,但同时在进行帧编码时,所有宏块都要按照每一种模式分别计算一次率失真代价,然后选中率失真代价最小的模式进行编码,这样编码器运算的复杂性极大增加了[7]。由于视频传输需要满足实时性的要求,而H.264的编码计算量又比MPEG-4、H.263等高出很多[8],成为了视频编码的瓶颈。因此,在尽可能小的质量损失前提下,尽可能的减少宏块做运动估计时的预测模式,成为了问题的关键,也是当前研究的焦点。
3 基于图像差分的快速模式选择算法(Fast mode
selection algorithm based on image difference)
为了快速的确定当前宏块的最佳帧间预测模式,有效降低模式选择时的运算量,在这里提出利用当前图像和参考图像匹配部分的差值分布来选择最佳模式的算法。利用当前视频图像信息和前帧视频图像的信息在时域上进行分析、比较,前期只需要少量的计算便能确定一种预测模式,从而减少了帧间预测的计算量,同时还可以避免分析单个图像无法包含序列运动特点的缺陷[9]。
关键词:H.264;图像差分;模式选择;边缘信息;帧间预测
中图分类号:TP391.41 文献标识码:A
Abstract:With the intra-frame prediction mode of H.264 video encoder,determining an intra-prediction mode of a macro block will bring great computational complexity.The paper proposes an efficient fast intra-prediction mode selection algorithm based on image difference.It adopts the idea of determination image sequence’s flatness to achieve fast inter-frame mode selection.This algorithm can reduce the times of search mode effectively and ensure the quality of video encoding,which can greatly decrease the encoding time and the computation of video compression and reduce the computational complexity of the inter-frame mode selection algorithm.It is conducive to real-time application.
Keywords:H.264;image difference;mode selection;edge information;intra-prediction
1 引言(Introduction)
随着移动通信和网络的发展,视频通信成为了移动通信的重要组成部分。视频压缩也制定了诸多标准,H.264/AVC[1]是国际视频编码标准之一,其能有效地提高视频编码效率,并具有良好的网络的适配性,其编码算法可广泛应用视频流媒体服务、数字电视、无线视频通信、IP视频会议和实时视频监控等领域,有着非常广泛的应用前景。
然而H.264/AVC在其良好性能提升的同时,算法的复杂度也大大地增加了,给视频通信带来了困难,不利于实际应用[2]。因此如何在保证帧间预测的编码效率情况下,采用实用有效的算法来提高H.264预测帧的编码速度,成为满足实时视频通信的要求的重要课题。通过分析研究H.264中的帧间模式选择算法,本文提出一种能够进行快速帧间模式预测的基于图像差分的选择算法。通过仿真实验,并与X264的测试结果进行对比,结果表明,图像差分快速算法可以在保证视频编码质量并能有效地减少搜索模式数,从而可大幅度降低编码时间和视频压缩的计算量,可应用于实际的视频通信中。
2 H.264 帧间模式选择算法(Intra-prediction mode
selection algorithm based on H.264)
最新的视频编码标准H.264与以往的编码标准相比具有良好的编码效率,例如,在相同的重建图像质量下,能够比H.263、MPEG4等节约50%左右的码率,这是因为H.264标准引入了如统一的VLC符号编码,高精度、多模式运动估计技术[3]。所谓多模式运动估计[4],就是将一个16×16宏块划分成16×16、16×8、8×16、8×8、8×4、4×8、4×4或者采用SKIP模式进行运动估计,如图1所示。
编码器遍历所有的模式,以公式计算RDO[5](率失真)为判决依据来寻求最佳匹配块,也就是在搜索范围内寻找使得公式达到最小值的参考帧中的宏块。
式中,=为运动矢量,是拉格朗日(Lagrange)乘数因子,是个常数[6],和量化参数QP和待编码块的类型有关,SAD为绝对误差和,s表示原视频信号,c表示解码视频信号,=为预测的运动矢量,R(m-P)为表示运动矢量差值所需的比特数。
多模式运动估计能够极大地提高了编码的效率,但同时在进行帧编码时,所有宏块都要按照每一种模式分别计算一次率失真代价,然后选中率失真代价最小的模式进行编码,这样编码器运算的复杂性极大增加了[7]。由于视频传输需要满足实时性的要求,而H.264的编码计算量又比MPEG-4、H.263等高出很多[8],成为了视频编码的瓶颈。因此,在尽可能小的质量损失前提下,尽可能的减少宏块做运动估计时的预测模式,成为了问题的关键,也是当前研究的焦点。
3 基于图像差分的快速模式选择算法(Fast mode
selection algorithm based on image difference)
为了快速的确定当前宏块的最佳帧间预测模式,有效降低模式选择时的运算量,在这里提出利用当前图像和参考图像匹配部分的差值分布来选择最佳模式的算法。利用当前视频图像信息和前帧视频图像的信息在时域上进行分析、比较,前期只需要少量的计算便能确定一种预测模式,从而减少了帧间预测的计算量,同时还可以避免分析单个图像无法包含序列运动特点的缺陷[9]。