论文部分内容阅读
近年来,随着互联网技术的发展和普遍应用,网络越来越影响人们的生产生活方式。由于视频信息具有直观性强,内容丰富等特点,因此视频传输在网络传输领域占据了越来越重要的地位。视频流式传输(也称流媒体)是其中一项迅猛发展的技术,能够满足人们迅即的学习娱乐需求。然而,在互联网上进行流媒体传输,对视频压缩,网络传输等提出了新的挑战。首先,由于不同的流媒体应用,人们对流媒体的质量、时延、交互性等要求也不同,所以需要压缩视频流具有服务质量的可适应性;其次,由于网络的异构性(Heterogeneity),服务质量QOS(Quality of service)的非确保性(Best-effort service),流媒体传输需要面对网络传输中可能遇到的各种问题,提供拥塞控制、带宽适应性和视频平滑等等;第三,用户解码设备解码能力和播放方式的多种多样,要求压缩传输的视频码流具有相应的结构来方便设备多种能力的解码和播放。所有这些的核心是要求编码和调度相配合,在一定的网络状况下,最大限度地满足客户端多种应用和多层次的需求。可伸缩性视频编码(例如MPEG-4 FGS和JVT SVC)和传输是流媒体中一项非常有希望的技术。本文从最基本的概率统计,信息论和量化理论入手,系统而且深入地研究了可伸缩性视频编码和传输的关键点:率失真函数(Rate-distortion function),设计了新的率失真函数模型,并在此基础上实现了一系列优化的视频编码和调度算法。本文主要的内容和创新点包括:由于广义高斯分布GGD(Generalized Gaussian distribution)的高度灵活性,理论上和实际中它都可以非常好地描述离散余弦变换(DCT)和小波变换(Wavelet transform)的编码系数(Transform coefficients)。本文通过信息论和量化理论的知识,分析了广义高斯分布GGD率失真函数的基本属性,数学上严格证明了:以峰值信噪比PSNR(Peak signal noise ratio)或信噪比SNR为失真标准,广义高斯分布GGD的失真速率函数(Distortion-rate function)的导数存在,并且与分布的方差无关。这样,实际中只需研究特定编码量化模式下GGD失真速率函数的导数与GGD形状参数的关系和规律,就可以重建相应编码模式下的失真速率函数。基于位平面的精细可伸缩性视频编码FGS是MPEG-4标准支持流媒体传输的关键技术。为了能够在不同的传输码率下平滑重建FGS目标视频流,基于帧的FGS增强层率失真函数的获取是一个非常关键的问题。本文首先通过广义高斯分布GGD描述了FGS增强层DCT系数的分布。然后分析了FGS编码的量化模式,并把它应用到GGD分布上,得到了GGD分布率失真函数的变化规律,从而获得实际FGS编码的率失真函数的变化规律,即FGS编码失真速率函数的导数先随着码率的增加而逐渐减小,然后在码率比较高的时候开始随码率的增加而缓慢地增加。在以上观察和分析的基础上,本文提出了一个灵活有效的率失真函数模型去近似实际的FGS率失真函数。大量的实验验证了模