论文部分内容阅读
随着数字视频技术、通信技术和超大规模集成电路技术的不断发展融合,各种先进的视频标准不断涌现,数字视频应用呈现出为多样化、高清晰度、移动化、网络化和智能化的趋势,对于数字视频处理器的需求现状则表现为多标准、高分辨率和超低功耗,研究低功耗多标准全高清解码系统芯片具有重要的研究价值和应用前景。本文以AVS、H.264/AVC、MPEG-4ASP等目前最先进视频标准为研究对象,对低功耗多标准全高清解码系统芯片关键技术进行了深入研究。研究主要内容和贡献包括:
1、研究了多标准视频解码器芯片系统级设计方法。分别提出了一种基于资源节约型的片上缓存分配策略和一种基于BMA(Block Macroblock Adaptive)的五级混合流水线结构,前者以微小的带宽需求增加为代价极大的减少了片上缓存需求,后者可充分利用子块级和宏块级流水线在性能、面积和功耗上的优势。此外,分析了同步流水线和基于数据驱动的异步流水线的性能,给出了流水线缓冲区深度对基于数据驱动的异步流水线结构的性能影响。
2、研究了多标准视频解码器芯片低功耗设计方法。对于码流处理引擎,提出一种基于操作数隔离技术的低功耗策略,避免多标准兼容导致的查表功耗增加。对于反变换引擎,分别提出一种基于掩蔽的变换系数存储器访问策略和一种细粒度的基于4×4子块级的反变换跳过策略,降低了残差存储器访问操作和运算量。对于帧内预测引擎,提出一种基于模式直通的邻域信息更新策略,减少了片上缓存的更新操作,从而降低了系统功耗;对于运动补偿引擎,结合基于可变块大小的运动补偿策略,提出一种基于垂直优先的插值调度策略,减少了水平插值运算。
3、对多标准视频解码器中运动补偿引擎的优化实现进行了深入研究。提出了一种适用于多标准的改进插值算法结构,在该结构中,各标准的亮度和色度分量的插值过程均具有统一的矩阵描述,降低了电路规模。实验评估表明,提出的插值结构中所引入的重建误差对图像质量几乎没有影响。为了进一步降低带宽和片上存储器的需求,提出了一种直接模式的运动矢量合并策略和紧耦合的流水线分配策略,对紧耦合流水线结构中参考像素FIFO深度对系统性能的影响进行了详细的实验评估,确定了FIFO深度的最优值。
4、对于多标准视频解码器中环路滤波引擎的优化实现进行了深入研究。针对MPEG-4ASP标准提出了一种高效的空域自适应图像后处理算法,相比传统算法,可获得更高的峰值信噪比增益,并能与H.264/AVC和AVS的环路滤波结构相兼容。此外,提出了一种基于虚边界技术的双滤波器结构,有效地解决了传统滤波调度策略中访存冲突和输出乱序的问题,并克服了传统实现方案中缓存资源和运算资源分布不均衡的问题。
5、对于多标准视频解码器中外部存储器访存和带宽优化进行了深入研究。为提高外部存储器的访存效率,提出了一种基于块的体交叠通用存储映射机制,给出了结合实验数据确定最优映射分块的方法。此外,提出了一种新颖的三维运动补偿Cache结构,相比于传统的二维运动补偿Cache结构,本文三维运动补偿Cache结构在性能、面积和功耗上均具有更大的优势。