论文部分内容阅读
目前,随着多媒体和宽带网络技术的发展,对多媒体数据压缩效率和应用的实时性要求越高。高清晰度电视的不断推广,使得实时处理高清海量级数据的要求成为必须。高速视频解码器是高清晰度电视接收机芯片的一个关键部分。高速视频解码器要实现对海量级数据作实时的解码,其关键是如何提高视频解码器的并行性。本文着重从并行处理技术为切入点对高速视频解码器并行结构的设计方法进行了深入的研究。并以变字长解码器和去块滤波器这两种不同计算类型模块的设计为例分析各种并行技术在细粒度开发中的应用。 任务的并行分为空间并行和时间并行。在高速视频解码器的并行结构研究中,首先对各种并行处理技术进行了深入的调研,对它们的特点和性能进行了比较,指出了各种并行处理技术在视频处理器的应用。硬件结构的并行性只有和算法的并行性相匹配才能发挥最大效用,通过分析当前流行的以离散余弦变换或者整数变换和运动估计为框架的混合编码算法为基础的视频压缩算法本身蕴涵的并行性,以及对解码任务的分析,提出了高速视频解码的多层次并行框架。从粗粒度到细粒度,从时间和空间两个方面对解码任务进行了并行划分。 在视频解码的各项任务中,变字长码解码属于串行运算,分支判断运算较多。对于这类运算,可以采用查表策略,将各种操作数的组合所产生的结果先计算出来,列成表格,存在存储器中。这样,串行的运算就可用简单的并行查表操作来代替。在查表实现时,还可以利用并行查表,将大码表分割成几个小的码表并行查表,进一步提高解码的并行度。并行查表的实现还需要数据能够并行准备,这通过对变字长码进行了改造和桶形移位器的设计来实现。所有这些措施使得每个时钟周期能够解码一个变字长码,达到实时解码要求。 去块滤波器除了具有较多的分支判断,还具有计算复杂性特点。分支判断是由环内滤波器的自适应性带来的。环内去块滤波器的自适应性从高到低分别体现在块边界级(Edge Level)、条带级(Slice-level)和样点级(Sample-Level)。多判断多分支不利于用通用处理器可编程方式来实现。在专用滤波器电路的设计中可以从多个层次利用时间和空间并行设计策略进行优化。一维边缘滤波器是环内去块滤波器的核心计算部件,通过适当的数据存储和调度使得水平滤波和垂直滤波复用一个一维滤波器,降低了资源开销。