ＡＶＳ数字音视频编解码标准

来源 :中兴通讯技术 | 被引量 : 0次 | 上传用户：lwangkun

【摘要】

：

【作者】

：

高　文　王　强　马思伟

【出处】

：

中兴通讯技术

【发表日期】

：

2006年3期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：数字音视频编解码标准(AVS)是中国自主制订的数字电视、IPTV等音视频系统的基础性标准。AVS标准第2部分视频(AVS1-P2)属高效的第二代视频编码技术，相比于第一代标准MPEG-2，编码效率提高2～3倍，并且实现方案简洁，因此，AVS视频标准已经为IPTV，数字电视广播等应用做好了充分的技术准备。同时，AVS标准具有专利许可方式简洁、相关标准配套的优势。这将为中国的IPTV、数字电视广播等重大信息产业应用及民族IT产业发展起到积极的推动作用。
　　关键词：数字音视频编解码标准；AVS标准第2部分；视频编码标准；数字电视广播
　　Abstract: Audio Video coding Standard (AVS), independently developed and owned by China, is a fundamental standard applied in digital TV, IPTV and other audio/video based systems. AVS Part 2 (AVS1-P2), the video part, defines the highly efficient second generation video coding technology, with the coding efficiency 2-3 times higher than the first generation standard like MPEG-2. Moreover, its implementation is simple and easy. Therefore, AVS1-P2 has made full technical preparation for such applications as IPTV and digital TV broadcast. Meanwhile, AVS possesses the advantages of simple intellectual property warranty and cooperative standards support. It will effectively push the development of national IT industry of China and its important information applications like IPTV and digital TV broadcast.
　　Key words: AVS; AVS1-P2; video coding standard; digital TV broadcast
　　
　　基金项目：国家“863”计划项目(2002AA119010、2004AA119010)；国家自然科学基金重点项目(60333020)
　　
　　从1952年贝尔实验室Cutler等人进行差分脉冲编码调制(DPCM)技术的研究开始，视频压缩编码技术经历了50余年的发展。在这一过程中，逐渐形成了变换编码、预测编码、熵编码3类经典技术，分别用于去除视频信号的空域冗余、时域冗余及统计冗余。并基于这些经典技术，逐渐形成了以块为单元的预测加变换的混合编码框架。到目前为止，已有的视频编码标准都基于这一框架，包括国际电信联盟(ITU-T)的H.261/3/4视频编码建议以及国际标准化组织/国际电工委员会(ISO/IEC)的MPEG-1/2/4视频编码标准。这些标准及其技术对视频信号提供了一种高效表达方式，使得巨大的视频数据能够在有限带宽下传输以及在有限空间下存储。其中，MPEG-2标准在世界范围内得到了广泛应用，已经成为电视广播应用的基础性支撑标准。但MPEG-2标准制订于1994年，属第一代视频编码技术，近10年视频编码技术的发展，使得MPEG-2标准在新一代IPTV、高清数字电视广播、无线移动媒体通信、流媒体服务等方面的应用上不再高效与经济。新的应用需要新的高效信源编码方案。
　　数字音视频编解码标准(AVS)标准第2部分：视频(AVS1-P2)^[1]的技术规范完成于2003年12月，该标准面向标清高清视频编码应用。AVS视频标准吸收了国内外研究机构近年来的优秀研究成果，属于高效的第二代视频编码技术。相比于MPEG-2标准，编码效率提高2～3倍。如果以AVS视频标准进行标清视频广播应用，可以将MPEG-2标准所需的5～6 Mb/s传输带宽降低到1.5～3 Mb/s。因此，即使在不进行大规模宽带光纤网络升级的情况下，借助于AVS视频技术，IPTV应用也可以在现有家用数字用户线(DSL)网络的2 Mb/s带宽下进行大规模实施。在新的宽带网络上，AVS视频标准将使业务量翻番。
　　在获得高编码效率的同时，AVS视频标准尽可能保持了低的计算实现复杂度。当编码高清视频信号时，AVS视频获得了与先进视频编码标准AVC/H.264主要档次(Main Profile)相当的编码效率，但解码器的实现复杂度只有其60%～70%。在专利许可方面，AVS通过简洁的一站式许可政策，解决了MPEG-4 AVC/H.264被专利许可问题缠身难以产业化的弊端，并且专利许可费用大大低于国际同类标准。
　　
　　1 AVS视频技术
　　
　　1.1 混合编码框架
　　AVS1-P2视频标准采用经典的混合编码框架，如图1所示。此框架与以往视频标准相同，但由于不同标准制订时出于对不同应用的考虑，在技术取舍上对复杂度-性能的衡量指标各不相同，因而在复杂性、编码效率上的表现也各不相同。比如，一般认为H.264的编码器大概比MPEG-2复杂9倍，而AVS视频标准则由于编码模块中的各项技术复杂度都有所降低，其编码器复杂度大致为MPEG-2的6倍，但编码高清序列AVS视频标准具有与H.264相近的编码效率。
　　在图1所示框架下，视频编码的基本流程为：将视频序列的每一帧划分为固定大小的宏块，通常为16×16像素的亮度分量及2个8×8像素的色度分量(对于4?誜2?誜0格式视频)，之后以宏块为单位进行编码。对视频序列的第一帧及场景切换帧或者随机读取帧采用I帧编码方式，I帧编码只利用当前帧内的像素作空间预测，类似于JPEG图像编码方式。其大致过程为，利用帧内先前已经编码块中的像素对当前块内的像素值作出预测(对应图1中的帧内预测模块)，将预测值与原始视频信号作差运算得到预测残差，再对预测残差进行变换、量化及熵编码形成编码码流。对其余帧采用帧间编码方式，包括前向预测P帧和双向预测B帧，帧间编码是对当前帧内的块在先前已编码帧中寻找最相似块(运动估计)作为当前块的预测值(运动补偿)，之后如I帧的编码过程对预测残差进行编码。编码器中还内含一个解码器，如图1中青绿色部分所示。内嵌解码器模拟解码过程，以获得解码重构图像，作为编码下一帧或下一块的预测参考。解码步骤包括对变换量化后的系数进行反量化、反变换，得到预测残差，之后预测残差与预测值相加，经滤波去除块效应后得到解码重构图像。以上编码框架包含如下关键技术：
　　●帧内预测
　　●多参考帧预测
　　●变块大小运动补偿
　　●1/4像素插值
　　●整数变换量化
　　●高效B帧编码模式
　　●熵编码
　　●环路滤波
　　
　　

　　1.2 AVS关键技术介绍
　　(1)帧内预测
　　AVS视频标准采用空域内的多方向帧内预测技术。以往的编码标准都是在频域内进行帧内预测，如MPEG-2的直流系数(DC)差分预测、MPEG-4的DC及高频系数(AC)预测。基于空域多方向的帧内预测提高了预测精度，从而提高了编码效率。AVC/H.264标准也采用了这一技术，其预测块大小为4×4及16×16，其中4×4帧内预测时有9种模式，16×16帧内预测时有4种模式。AVS视频标准的帧内预测基于8×8块大小，亮度分量只有5种预测模式，大大降低了帧内预测模式决策的计算复杂度，但性能与AVC/H.264十分接近。除了预测块尺寸及模式种类的不同外，AVS视频的帧内预测还对相邻像素进行了滤波处理来去除噪声。关于帧内预测技术的详细描述参见文献^[2]。
　　

　　(2)变块大小运动补偿
　　变块大小运动补偿是提高运动预测精确度的重要手段之一，对提高编码效率起重要作用。在以前的编码标准MPEG-1、MPEG-2中，运动预测都是基于16×16的宏块进行的(MPEG-2隔行编码支持16×8划分)，在MPEG-4中添加了8×8块划分模式，而在H.264中则进一步添加了16×8、8×16、8×4、4×8、4×4等划分模式。但实验数据表明小于8×8块的划分模式对低分辨率编码效率影响较大，而对于高分辨率编码则影响甚微，如图2所示。在高清序列上的大量实验数据表明，去掉8×8以下大小块的运动预测模式，整体性能降低2%～4%，但其编码复杂度则可降低30%～40%。因此在AVS1-P2中将最小宏块划分限制为8×8，这一限制大大降低了编解码器的复杂度。
　　(3)多参考帧预测
　　多参考帧预测使得当前块可以从前面几帧图像中寻找更好的匹配，因此能够提高编码效率。但一般来讲2～3个参考帧基本上能达到最高的性能，更多的参考图像对性能提升影响甚微(如图3所示)，复杂度却会成倍增加。H.264最多可采用16个参考帧，并且为了支持灵活的参考图像引用，采用了复杂的参考图像缓冲区管理机制，实现较繁琐。而AVS视频标准限定最多采用两个参考帧，其优点在于：在没有增大缓冲区的条件下提高了编码效率，因为B帧本身也需要两个参考图像的缓冲区。
　　

　　(4)1/4像素插值
　　MPEG-2标准采用1/2像素精度运动补偿，相比于整像素精度提高约1.5 dB编码效率；H.264采用1/4像素精度补偿，比1/2精度提高约0.6 dB的编码效率，因此运动矢量的精度是提高预测准确度的重要手段之一。影响高精度运动补偿性能的一个核心技术是插值滤波器的选择。AVC/H.264亚像素插值半像素位置采用6拍滤波，这个方案对低分辨率图像效果显著。由于高清视频的特性，AVS视频标准对1/2像素位置插值采用4拍滤波器^[3]，其效果与6拍滤波器相同，优点是大大降低了访问存取带宽，是一个对硬件实现非常有价值的特性。
　　(5)B帧宏块编码模式
　　在AVC/H.264标准中，时域直接模式与空域直接模式是相互独立的。而AVS视频标准采用了更加高效的空域/时域相结合的直接模式，并在此基础上使用了运动矢量舍入控制技术^[4]， AVS标准B帧的性能比H.264中B帧性能有所提高。此外，AVS标准还提出了对称模式^[5]，即只编码前向运动矢量，后向运动矢量通过前向运动矢量导出，从而实现双向预测。此方案与编码双向运动矢量效率相当。
　　(6)整数变换与量化
　　AVS视频标准采用整数变换代替了传统的浮点离散余弦变换(DCT)。整数变换具有复杂度低、完全匹配等优点。由于AVS1-P2中最小块预测是基于8×8块大小的，因此采用了8×8整数DCT变换矩阵。8×8变换比4×4变换的去相关性能强，在变换模块，AVS标准编码效率相比H.264提高2%(约0.1 dB)。同时与H.264中的变换相比，AVS标准中的变换有自身的优点，即由于变换矩阵每行的模比较接近，可以将变换矩阵的归一化在编码端完成，从而节省解码反变换所需的缩放表，降低了解码器的复杂度^[6]。
　　量化是编码过程中唯一带来损失的模块。以前典型的量化机制有两种，一种是H.263中的量化方法，一种是MPEG-2中的加权矩阵量化形式。与以前的量化方法相比，AVS标准中的量化与变换归一化相结合，同时可以通过乘法和移位来实现，对于量化步长的设计，量化参数每增加8，相应的量化步长扩大1倍。由于AVS标准中变换矩阵每行的模比较接近，变换矩阵的归一化可以在编码端完成，从而解码端反量化表不再与变换系数位置相关。
　　(7)熵编码
　　熵编码是视频编码器的重要组成部分，用于去除数据的统计冗余。AVS视频标准采用基于上下文的自适应变长编码器^[7]对变换量化后预测残差进行编码。其具体策略为，系数经过“之”字形扫描后，形成多个(Run，Level)数对，其中Run表示非零系数前连续值为零的系数个数，Level表示一个非零系数；之后采用多个变长码表对这些数对进行编码，编码过程中进行码表的自适应切换来匹配数对的局部概率分布，从而提高编码效率。编码顺序为逆向扫描顺序，这样易于局部概率分布变化的识别。变长码采用指数哥伦布码，这样可降低多码表的存储空间。此方法与H.264用于编码4×4变换系数的基于上下文的自适应变长编码器(CAVLC)具有相当的编码效率。相比于H.264的算术编码方案，AVS的熵编码方法编码效率低0.5 dB，但算术编码器计算复杂，硬件实现代价很高。
　　(8)环路滤波
　　起源于H.263++的环路滤波技术的特点在于把去块效应滤波放在编码的闭环内，而此前去块效应滤波都是作为后处理来进行的，如在MPEG-4中。在AVS视频标准中，由于最小预测块和变换都是基于8×8的，环路滤波也只在8×8块边缘进行，与H.264对4×4块进行滤波相比，其滤波边数变为H.264的1/4。同时由于AVS视频滤波点数、滤波强度分类数都比H.264中的少，大大减少了判断、计算的次数。环路滤波在解码端占有很大的计算量，因此降低环路滤波的计算复杂度十分重要。
　　

　　
　　1.3 编码效率对比
　　以上是从编码模块各个方面认识AVS，从中不难看出AVS视频标准对每项技术都进行了复杂性与效率的权衡，为所面向的应用提供了很好的解决方案，努力降低复杂度，并保证高的编码效率。
　　表1给出了2005年8月中国国家广电总局广播电视规划院主持完成的AVS1-P2视频标准测试结果，整体结论为性能优良。考虑到目前使用MPEG-2标准实施高清电视广播时，一般使用20 Mb/s的码率；使用MPEG-2标准实施标清电视广播时，一般使用5～6 Mb/s的码率。对照测试结果可以得知，AVS视频码率为MPEG-2标准的一半时，无论是标准清晰度还是高清晰度，编码质量都达到优秀。码率不到其三分之一时，也达到良好到优秀。因此在比MPEG-2视频编码效率提高2～3倍的前提下，AVS视频质量完全达到大范围应用所需的“良好”要求。
　　表2、表3分别给出了AVS1-P2与MPEG-2标准以及AVS1-P2与MPEG-4 AVC/H.264标准主要档次的客观编码性能对比，结果为相同码率条件下峰值信噪比(PSNR)的增益。可以看出，AVS1-P2相对于MPEG-2标准编码效率平均提高2.56 dB，相比于H.264标准编码效率略低，但平均只有0.11 dB的损失。
　　
　　2 AVS标准的特色
　　
　　AVS视频标准高效的技术、简洁的实现方案为其成功应用奠定了基础。但要得到市场认可，还需要其他方面优势的配合。MPEG-4标准没有广泛应用的一个重要原因是过度的专利保护所导致的高额专利费限制了技术的推广。因此，AVS标准制订之初就认真分析了国内外标准和知识产权领域的经验教训，充分考虑知识产权问题对标准推广的影响，定义专利技术被标准接受的基本原则为：为保证标准的先进性，AVS标准不排斥各种专利技术，但专利进入AVS标准必须遵守一定的条件，必须将专利的利益索求限制在一个合理的水平上，以保证标准的公益性。AVS通过简洁的一站式许可方式，解决了MPEG-4 AVC/H.264被专利许可问题缠身难以产业化的弊端。AVS视频标准不同于H.264标准，后者是一个独立的视频标准，而AVS标准是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系，这保证了实际应用系统所需的技术完备性。因此AVS视频标准具有技术高效、实现方案简洁，专利许可政策简单、许可费用低廉，相关标准配套的特色。
　　
　　3 结束语
　　
　　AVS1-P2已经由国家标准化管理委员会批准，正式成为国家标准，并于2006年3月1日起正式实施。AVS标准将凭借其先进的技术和低廉简洁的专利许可方式为中国IPTV、高清数字视频广播等重大信息产业应用起到积极的推动作用。
　　
　　4 参考文献
　　
　　[1] GB/T 20090.2-2006信息技术先进音视频编码，第2部分：视频[S]. 2006.
　　[2] ZHANG Nan, YIN Bao-cai, KONG De-hui, et al. Spatial prediction based intra-coding[C]//Proceedings of the 2004 IEEE International Conference on Multimedia and Expo (ICME'2004), Vol 1. Jun. 27-30, 2004, Taibei, China. New York, NY,USA:IEEE, 2004:97-100.
　　[3] WANG Rong-gang, HUANG Chao, LI Jin-tao, et al. Sub-pixel motion compensation interpolation filter in AVS[C]//Proceedings of the 2004 IEEE International Conference on Multimedia and Expo (ICME'2004), Vol 1. Jun. 27-30, 2004, Taibei, China. New York, NY,USA:IEEE, 2004:93-96.
　　[4] JI Xiang-yang, ZGAO De-bin, GAO Wen, et al. New scaling technique for direct mode coding in B pictures[C]//IEEE International Conference on Image Processing (ICIP 2004). Oct 24-27, 2004, Singapore. Piscataway, NJ,USA:IEEE, 2004:469-472.
　　[5] JI Xiang-yang, ZHAO De-bin, GAO Wen, et al. New Bi-prediction techniques for B pictures coding[C]//Proceedings of the 2004 IEEE International Conference on Multimedia and Expo (ICME'2004), Vol 1. Jun.27-30, 2004, Taibei, China. New York, NY,USA:IEEE, 2004: 101-104.
　　[6] MA Si-wei, GAO Wen, FAN Xiao-peng. Low complexity integer transform and high definition coding[C]//Proceedings of SPIE 49th Annual Meeting,Vol 58. Aug 02-06, 2004, Denver, CO, USA. Bellingham, WA,USA:SPIE Press, 2002:547-554.
　　[7] WANG Qiang, ZHAO De-bin, MA Si-wei, et al. Context- based 2D-VLC for video coding[C]//Proceedings of the 2004 IEEE International Conference on Multimedia and Expo (ICME'2004), Vol 1. Jun.27-30, 2004, Taibei, China.New York, NY,USA:IEEE, 2004: 89-92.
　　
　　收稿日期：2006-03-07
　　
　　作者简介
　　高文，中国科学院计算技术研究所研究员，中国科学院研究生院教授、博导，北京大学、哈尔滨工业大学教授，数字音视频编解码技术(AVS)标准化工作组组长，计算机学报主编，中国图像图形学会副理事长，中国软件行业协会副理事长，国务院学位委员会计算机学科评议组成员，ISO/IEC JTC1/SC29/WG11(MPEG)国际标准化委员会中国代表团团长，IEEE视频信号处理和通信技术委员会委员。
　　
　　王强，哈尔滨工业大学在读博士，主要从事视频编码技术、熵编码技术研究工作，已在国际会议及期刊上发表4篇学术论文，并获得北京市科技进步一等奖。
　　
　　马思伟，中国科学院计算技术研究所毕业，博士。现工作于中国科学院计算技术研究所，主要从事视频压缩方面的研究工作，包括视频编解码器设计、编码优化等研究内容，参与了国际标准H.264、中国标准AVS的制订，已提交3项国际标准技术提案，发表13篇技术论文，申请专利10项，获中国科学院院长奖特别奖。

其他文献

Ｌ１ＶＰＮ的现状与未来发展

Current Status and Future Development of L1VPN　　摘要：智能光网络以及自动交换光网络/通用多协议标记交换(ASON/GMPLS)的快速发展为现有网络带来了许多新的增值业务，其中包括新的层一的虚拟专用网(L1VPN)业务。L1VPN应用模式有多种，国际电信联盟电信标准部门(ITU-T)的标准中定义了4种应用场景，分别是多业务骨干网、运营商的运营商(Car

期刊

ＩＰＴＶ助推数字家庭时代的到来

摘要：不同行业都在关注数字家庭的发展，但数字家庭发展缓慢的现状不容忽视。现阶段来看通信和媒体娱乐业务是数字家庭市场需求的重点，基于电信网络的数字家庭通过借助IPTV的音视频和增值应用业务可以顺应此要求。IPTV业务包括基本的音视频广播、点播、时移业务，以及信息服务、音视频通信、互动游戏、即时通讯、卡拉OK、远程教育等增值应用服务，非常适合数字家庭的发展需要，将使数字家庭的应用变得更为现实。未来，进

期刊

内嵌ＭＰＬＳ的多业务传送平台

摘要：为了提高多业务传送平台(MSTP)组网的路由能力、交换能力不口服务质量(QoS)处理能力，需要将多协议标签交换(MPLS)的固有优势引入MSTP。方法是通过内嵌MPLS的MSTP，实现将以太网业务适配到MPLS层，然后映射到SDH通道中传送。MPLS技术通过将交换的概念引入MSTP，实现了数据流的统计复用不口负载均衡；通过将QoS引入MSTP，实现了对各种新兴业务的支持；通过基于二层和三层技

期刊

单芯片ＭＳＴＰ系统

摘要：迅速发展的城域网多业务传送平台(MSTP)依托于SDH技术，大量应用需要经济的解决方案。方法是采用单芯片的MSTP系统将相关通信新技术、新协议进行高度集成，开发成专用芯片。单芯片MXMSTP-8可在SDH STM-1等级上提供可扩展的MSTP解决方案，从而实现完善的管理以及电信与计算机数据的融合传输。　　关键词：单芯片系统；下一代SDH；多业务传送平台

期刊

ＩＰＴＶ运营模式探讨

摘要：IPTV是目前全球电信运营商都高度重视的宽带视频业务，有着广阔的发展前景，但也面临许多挑战，特别是运营模式亟需确定。结合IPTV业务具有互动性与个性化的特点，在中国行业管制的背景下，电信运营商开展IPTV业务可以根据具体情况选择采用标准IPTV模式、IP+TV模式或纯IP模式。IPTV在中国的发展还面临许多挑战，如监管政策不明朗，行业壁垒难以打破，赢利模式不明晰，技术规范不完善，但大趋势决定

期刊

应进一步提升中国ＩＣＴ企业的自主创新能力

编者按：《国家中长期科技发展规划纲要》指明了科技创新的领域和方向，要求在若干重要领域掌握一批核心技术，拥有一批自主知识产权，造就一批具有国际竞争力的企业。信息产业部电信研究院资深专家雷震洲先生呼吁在政府的扶持下，中国ICT企业利用3G商用的机会，在3G产业发展中担当主要角色，进一步提升自主创新能力。　　　　1 企业是技术创新的主体　　　　新制订的《国家中长期科技发展规划纲要》指出：中国要在激烈的国

期刊

ＩＰＴＶ终端与平台标准化接口模型研究

摘要：IPTV产业近年来在全球发展迅速，是三重播放业务的典型代表。但是终端与平台接口标准的缺乏成为制约IPTV发展的“瓶颈”。实现IPTV标准化的进程需要研究IPTV与广播、通信及互联网3种体制的关系。采用IPTV终端与三网的横向接口模型，可以解决目前在业务整合阶段标准化接口模型架构的问题；采用以横向架构为基础的纵向协议接口模型，可以确定协议接口标准化向全IP演进的方向；以标准协议接口为基础，在I

期刊

ＡＶＳ与ＩＳＭＡ共建ＩＰＴＶ标准平台

摘要：数字音视频编解码技术标准(AVS)是中国自主制订的数字电视等音视频系统的基础性标准，是网络电视(1PTV)系统可选择的两种第二代音视频信源编码标准之一。AVS基于创新技术和公开技术，编码效率比第一代标准(MPEG-2)高2—3倍，可节省一半以上信道资源。AVS标准简单的许可政策与开放式制订模式也使其成为新一代音视频编解码国际标准的上选。互联网流媒体联盟(ISMA)是得到广泛支持的IPTV系统

期刊

ＭＳＴＰ内嵌ＲＰＲ技术在城域网中的组网应用

摘要：由于网络电视(IPTV)、3G业务的开展，网络业务呈现多样化，对业务的可靠承载传送和带宽的高效利用提出了更高的要求，需要通过技术手段加以解决。利用多业务传送节点(MSTP)内嵌弹性分组环(RPR)技术所具有的业务分类传送、快速保护倒换、公平接入机制及高效带宽利用的特点，在城域网组网中实现了快速提供大客户专线业务、IPTV业务的有保障传送和3G接入传输网建设的最优化等应用。该技术已被中兴通讯在

期刊

ＷＣＤＭＡ高速上行分组接入技术性能研究

摘要：在高速上行分组接入(HSUPA)中通过采用NodqB控制调度、结合软合并的混合自动重传请求(HARQ)、更短的传输时间间隔(TTI)等关键技术，可使用户设备(UE)能以尽可能高的功率传输HSUPA数据，在减少时延的基础上得到更大的系统上行吞吐量。系统级仿真结果表明这些关键技术的引入对WCDMA通信系统上行数据传输带来了性能的提高。文章认为由于调度器的变化，不同调度算法在HSUPA系统中的表现

期刊

ＡＶＳ数字音视频编解码标准

与本文相关的学术论文