论文部分内容阅读
数字化音视频产业是国民经济与社会发展的重要产业,是信息产业三大组成部分之一,而视频编解码技术是整个产业依赖的关键技术。AVS(Audio Videocoding Standard)是中国自主的数字音视频编解码技术标准,是数字电视、宽带网络流媒体、移动多媒体通信、激光视盘等数字音视频产业群的共性基础标准。AVS的编码效率比MPEG-2标准高2~3倍,与MPEG-4,H.264标准编码效率相当,但技术方案更为简洁。2006年,信息产业部批准通过了AVS成为音视频国家标准,AVS的产业化每年可节省数十亿美元专利费,因此AVS高清实时编码芯片的研究具有十分重要的意义和良好的市场前景。
本文全面介绍了AVS视频编码核心技术,AVS高清编码器的整体结构设计,并深入研究了基于率失真优化的模式决策算法,提出了可以满足720P@30fps和1080P@30fps高清实时编码的快速模式决策算法。该算法采用了模式预选技术用以减少通过率失真优化模式决策的候选模式,以减少整个系统的吞吐量:采用四路并行的熵编码技术以减少模式决策内部的流水时钟数;采用重构像素和编码码字复用的技术,在生成实际编码码流的过程中不用再次生成重构像素和编码码字。该算法在保证实时编码的前提下,尽量复用现有的电路以减少资源的消耗。本论文的主要创新点包括:
(1)基于SAD的模式预选技术
本文通过对AVS中的各种编码模式进行数学统计,得到各个模式出现的频率,对于出现频率较低的几种模式采用基于SAD的判别方法选出若干SAD最优的模式,然后和频率较高的几种模式一起再做基于率失真优化的模式决策,最后得到一种最优的编码模式。通过模式预选技术可以较大的减少系统的数据吞吐量,这样在系统频率较低的情况下仍然可以达到实时编码的需求。同时,由实验得出在编码性能上,模式预选技术的PSNR和所有模式都做基于率失真优化模式决策的算法相比下降很小。
(2)四路并行熵编码技术
本文提出四路并行的熵编码技术,从zigzag扫描开始就四路并行的扫描一个8×8块的量化系数,得到(run,level)对和码表号。由于把一个完整的8×8块分成了4段扫描,所以扫描完之后需要做拼接工作才能得到正确的(run,level)。由于码表存在上下文的相关性,所以在扫描的同时需要将所有的切换情况都保存下来。有了正确的(run,level)对和对应的码表号之后,同样也是四路并行的查找编码码字codenum,最后估计出一个块的编码比特数。相比传统的单路扫描方法,本文的四路并行算法提高了3.4倍的速率。
(3)编码复用技术
无论采用什么的模式决策方法,AVS编码器中总是有蝶形运算,量化,逆量化,逆蝶形运算,熵编码等电路。本文采用PDO的模式决策方法,并且将每种模式的重构像素和编码码字存储起来,等决策出最优的模式之后,直接从存储单元中取出最优的重构像素和码字,无需再做一遍编码。利用现有的电路和额外的存储单元节省编码的时间。
本文提出的RDO模式决策算法均已仿真和综合并且在FPGA上实现,测试结果表明算法是合理有效的并且完全符合AVS高清实时编码的需求。