论文部分内容阅读
近年来,信息技术飞速发展,社会的信息化程度不断提高,人们对图像/视频信息的需求越来越迫切,数字图像/视频的应用领域也越来越广泛,图像/视频编码技术受到了前所未有的重视,众多学者对此进行了深入而广泛的研究。
小波分析是当前在图像/视频编码研究领域倍受关注的一个数学分析方法。小波分析所具备的多分辨率特性、能量集中特性和熵保持特性为后期获得高性能的编码提供了巨大的潜力,这使得小波编码成为图像/视频编码研究的热点之一。
本文系统地介绍了作者近几年来在基于小波理论的图像/视频内嵌编码领域的主要研究工作和成果,对当前流行的基于小波理论的图像/视频内嵌编码技术进行了比较细致的理论分析和算法研究,并对小波图像/视频内嵌编码技术的实际应用进行了比较深入的探索。
内嵌零块和基于上下文的编码算法-EZBC采用链表来控制位平面编码。但是链表需要大量且非固定的存储空间,这造成了EZBC算法硬件实现的障碍。在研究EZBC算法的基础上,本文提出了一种无链表实现内嵌零块和基于上下文编码算法,即NLEZBC算法,并且设计了NLEZBC算法的实现架构。NLEZBC算法构造了一个位平面节点重要性状态表,利用节点的重要性状态来控制编码过程和形成算术编码器所需要的上下文,从而取代EZBC算法中的LIN和LSP链表。实验结果表明,在1bits/pixel压缩时,NLEZBC算法中的重要性状态表所需存储空间大约为EZBC算法中链表所需存储空间的20%左右;NLEZBC算法能在较低、固定存储空间的情况下获得和EZBC基本相同的高压缩性能,有利于硬件实现,有重要的实用价值。
三维EZBC算法结合可逆运动补偿时域滤波器(IMCTF)就形成了可逆的运动补偿三维EZBC算法,即IMC3D-EZBC算法。在对IMC3D-EZBC算法研究的基础上,作者针对IMC3D-EZBC算法中的HVSBM算法和3D-EZBC算法分别进行改进,提出了一种改进的小波内嵌视频编码算法,即快速的可逆运动补偿、无链表结构三维内嵌零块和基于上下文编码算法(FIMCN3D-EZBC)。FIMCN3D-EZBC包括FIMCTF和NL3D-EZBC:基于HVSBM快速实现算法-FHVSBM来进行运动估计的IMCT被称为快速IMCTF,即FIMCTF;无链表结构实现的3D-EZBC算法被称为NL3D-EZBC。
FHVSBM算法有效地利用了所建立的多分辨率金字塔结构。在细化过程中,不仅仅只对匹配子块细化,而是在对匹配子块细化的同时,细化运动矢量。在对运动矢量进行细化时,本文充分利用上一金字塔级内搜索块的运动矢量,因此不再进行全搜索,定义计算搜索块在当前金字塔级内运动位移更新值的搜索范围为±1,大大减少了运算量。NL3D-EZBC算法是本文将NLEZBC算法在视频编码的扩展。NL3D-EZBC算法建立了一个三维的重要性状态表来判断节点或像素是否需要进行编码而不是用链表来记录它们的坐标值。实验表明,本文所提出的FIMCN3D-EZBC算法在运动估计时,最大运算量仅约为IMC3D-EZBC算法的33%左右,但是此时FIMCN3D-EZBC的性能已经接近原始算法,相差约0.3dB左右。
巨大的运算量和大量的存储器资源需求是JPEG2000硬件实时实现的瓶颈。本文针对此点,提出了两种基于JPEG2000标准、高效的率控制算法—基于码块重要性编码顺序的MSD算法(MSDS)和基于码块重要性编码顺序及门限的MSD算法(MSDST)。MSDS和MSDST算法均在对数域中对率失真斜率进行比较,从而避免了斜率浮点运算,使得算法更易于硬件实现。在MSDS算法中由于设定了码块重要性编码顺序,所以具有比最小斜率丢弃算法(MSD)更高的编码效率,而且获得了与标准原始算法基本相同的高压缩性能;MSDST算法在MSDS算法的基础上,不仅设定了码块编码顺序,还设定了位平面编码控制门限,从而进一步降低了在编码初期存在的冗余。
实验结果表明,本文提出的MSDS和MSDST算法具有比MSD算法和传统的率失真后压缩优化截取算法(PCRD)更高的编码效率;而MSDST算法的编码效率还略高于MSDS算法,尤其是在甚低比特率情况下。
本文提出了一种缓存资源有限条件下、基于Motion-JPEG2000标准的常质量视频编码的码率控制算法—单缓存器双门限码率控制算法(SBDTRC)。SBDTRC算法采用了单缓存器架构和两种截取门限:首先利用R-D斜率门限将所有候选编码码流放入缓存器内,然后利用帧失真门限截取合适的、需释放到输出码流中的编码码流。为了实现简单,SBDTRC算法直接利用小波/子带系数的失真来代替空间域中像素的失真。实验结果表明,SBDTRC算法的性能曲线比CBRC、DBRC算法的性能曲线光滑,PSNR方差小于CBRC和DBRC算法的方差。SBDTRC算法适于有限缓存条件下的常质量视频编码。