论文部分内容阅读
本文首先针对帧间亮度变化剧烈时运动补偿预测效率会大大降低这一情况,讨论了适应于帧间亮度变化的运动补偿预测方法.随后将主要就可伸缩编码中的空域可伸缩功能的实现进行研究探讨,提出了基于联合运动估计的空域可伸缩视频编码框架及利用DCT系数切分实现空域可伸缩功能的方法.本文的主要研究成果如下:1.提出了亮度变化自适应的运动补偿预测方法,可以减弱视频帧间的各种亮度变化带来的影响,大大提高运动补偿预测的效率.运动补偿预测是视频编码的关键技术,大多视频编码系统都采用了基于SAD块匹配的方法进行运动补偿预测.而SAD块匹配准则在视频帧间有明显的亮度变化时会严重影响运动估计的准确性,增大残差系数,降低运动补偿预测的效率;而且预测效率的突然降低还会引起帧码率的突变,增大码率控制的难度,不利于网络传输.这一问题得到了学术界的高度重视,很多处理方法被提了出来.但已有方法大都针对镜头切换时的淡入淡出特效情况提出来的,通常在帧一级或条带(Slice)一级作处理,这对全局性均匀渐变的亮度变化有较好的效果,但对全局非均匀或局部的亮度变化效果就较差,而后两种亮度变化也是普遍存在的.本文提出的亮度变化自适应的运动补偿预测方法,在宏块一级做调控,运用新的变换及参数计算编码方法,可以很好的处理全局和局部的亮度变化,大大提高运动估计的准确性,使视频帧码率更为平滑,极大提高视频压缩效率.2.提出基于联合运动估计的空域可伸缩视频编码框架,在少量降低基本层编码效率的情况下,大大提高增强层的编码效率.视频码流主要包含残差,运动向量和模式选择三项数据.而空域可伸缩视频编码中低分辨率的视频通常由高分辨率的视频下采样得来,它们之间在这三个方面都存在着大量的冗余.MPEG-2中提出的空域可伸缩视频编码框架以其简单实用而得到了广泛的应用,很多改进算法都是基于这一框架提出来的.但该框架只部分消除了残差方面的冗余,编码效率不高是它的最大缺点.本文提出的基于联合运动估计的空域可伸缩视频编码框架,通过联合基本层和增强层作运动估计,只生成一套运动向量和模式选择,这样可以极大的减少运动向量和模式选择方面的冗余;同时使用了将基本层重构图像作为增强层预测图像的选择之一的方法,可以很好的减少残差方面的冗余.这样就可以减少上述三个方面的冗余,大大提高增强层的编码效率.该框架为了保证增强层的运动补偿预测效率,设定运动向量精度是基于增强层的,这个增强层精度的运动向量将编入基本层中,必然会增加基本层的负担.但通过在基本层追加插值及调整运动估计参数等方法,可以保证基本层性能的下降在可接受范围之内.相较于增强层压缩效率的提高,这个基本层性能的下降是完全值得的.3.提出增强层与基本层在频域内结合生成增强层预测图像的方法.在MPEG-2空域可伸缩编码框架中,为了减少基本层和增强层之间的冗余,增强层的预测图像有三个.一是增强层自身作帧内或帧间预测产生,二是基本层重构图像上采样,三是前两者的均值结合.其中第三个预测图像与前两个有重复之感,效果不够好.考虑到使用DCT变换下采样时,基本层图像是增强层图像去掉高频信息后的产物.因此在生成增强层预测图像时,可以走一个相反的过程,即以基本层为低频部分,结合增强层的高频部分,构成一个具有完整频域信息的图像,然后反变换即可得到一个新的增强层预测图像.以这个频域内结合生成的预测图像代替第三个预测图像,可以收到很好的效果.4.提出通过DCT域中系数切分实现视频编码空域可伸缩功能的方法.标准DCT变换有一个重要的特性,即对一个NxN的图像块做NxN的变换后,取其左上角MxM的系数,乘上M/N的放缩因了,再做一个MxM的DCT反变换,可以得到一个MxM的图像块.这个MxM图像块是原来NxN图像块的缩小版.DCT的这个特性常被用来作为图像下采样的一种方法,在视频转码中有很多研究应用.我们也可以利用这一特性来实现视频的空域可伸缩.在对视频预测的残差系数做DCT变换之后,左上角的低频信息自动地对应于低分辨率的视频图像.因此可以考虑将左上角低频信息单独编码生成基本层,其余高频信息编入增强层,结合分块的残差系数扫描方式,可以简单高效的实现我们需要的空域可伸缩功能.该方法的关键在于作运动估计时的参考图像选择,如果选择基本层则效率太低,而如果选择增强层,则在解码基本层时会有漂移误差(driRing).我们设定阈值来控制漂移误差的累积程度,通过恢复机制以达到提高编码效率和控制漂移误差之间的平衡.