论文部分内容阅读
与H.264相比,高效视频编码标准(HEVC)在保证视频质量相近的情况下,压缩率可提高一倍。然而,HEVC在获得高效的编码性能的同时也使其编码复杂度急剧提高,需要编码处理终端拥有更高的数据处理能力才能达到实时编码的要求,这给HEVC的推广应用产生了不利影响。熵编码和去方块滤波是HEVC编码器中的两个关键模块,本文基于项目的实际需求,在BWDSP平台上对熵编码和去方块滤波模块进行优化实现,其目的就是减少两个模块的运算复杂度,提高其运行速度,为HEVC实时编码奠定基础。 本文首先基于BWDSP分别对熵编码和去方块滤波模块的运算复杂度进行深入分析。其次,基于BWDSP搭载的硬件资源,分别从算法级优化、系统级优化和代码级优化3种不同层级的组合优化方案对熵编码和去方块滤波模块进行优化处理。(1)算法级优化,本文提出一种基于划分深度的提前终止非滤波边界进入后续处理的方法,该方法在不影响码率的情况下大大减少了去方块滤波过程中无用的工作量,并提出了一种改进的变换系数熵编码结构,该结构减少了原算法结构中大量的条件分支,易硬件实现。(2)系统级优化,提出了一种基于BWDSP的熵编码存储器优化策略,权衡了熵编码速度和有限的片内存储器之间的矛盾,并提出了一种基于乒乓buffer的DMA数据传输优化方法,该方法提高了数据吞吐率,加快了熵编码运行速度。(3)代码级优化,主要采用循环展开、软件流水和加强指令并行优化方法进行汇编优化设计,并针对变换系数矩阵中最后一个非零系数的位置等信息的扫描过程设计了一种基于单核DSP的多任务级并行处理优化方案,该优化方案的执行速度是其传统串行汇编优化方法的7倍以上,并对上下文模型初始化过程和强滤波过程分别设计了相应的并行处理架构。 最后,通过实验结果表明,经过优化,HEVC熵编码和去方块滤波模块的运行速度显著提高,平均加速比分别达到15倍和6倍。