论文部分内容阅读
[摘要]国际标准化组织于1996年设定了运动图像压缩编码标准MPEG,将其作为运动图像及与其相关的音频等信息压缩的国际使用标准。MPEG研究的是数字存储媒体上的运动图像及其伴音的编码表示,其系统部分强调将一个或多个音频、视频和其他基本数据流合成单个或多个数据流,以适应存储和传输。本文对ISO/ IEC多通道音频编码系统进行了较详细描述,通过分析音频编码技术,为系统建成初期的验收提供可靠保障,确保系统正常运行。
[关键词]MPEG 多通道音频 低比特率编码
由于Internet的迅猛发展和无线通信的普及,视频和音频压缩编码的目标也从传统的面向存储变为面向传输。MPEG组织颁布的MPEG-l(ISO/IEC 11172)标准主要是为数字媒介(DSM)中的视频、音频信息压缩而提出,被应用于CD—ROM、数字录音带(DAT)、计算机硬盘和CD-R、CD—RW等。新一代的视频压缩编码国际标准中的精细可扩展性(fine granular scalable FGS)编码提供了完全可扩展的增强层码流,它可以在任何地点截断,具有极强网络带宽适应能力。
一、ISO/ IEC通用多通道音频编码系统
MPEG-1系统编码层允许把一个或者多个基本流组合成单个流,它将来自每个基本流的数据经过多路复用后,和附带信息一起编码,从而允许基本流能实现同步重新播放。音频基本流的表示单元是一组与来自音频帧样本所对应的样本数据。以MPEG-1为例,仅使用Layer 其单声道的速率为 32-192Kb/s,立体声速率为64-384Kb/s;对MPEG-2而言,主体流与MPEG-1相同,扩展流的速率可达528Kb/s,加上主体流后的综合速率则高达912Kb/s。
单声道或者立体声音频信号的低比特率编码标准是由ISO/IEC 11172-3 中的MPEG-1 Audio建立的,可以应用于存储介质,或者应用于有限容量传输通道中与图像信息相关的高质量数字化音频信号。在仅需两个通道立体声时,ISO/IEC 11172-3 音频编码标准可以和MPEG-1及MPEG-2一起使用。MPEG-2 Audio(ISO/IEC 13818-3)提供了扩展到3/2多通道音频的能力和一个可选的低频增强通道(LFE)。在双声道音频系统中,通用多通道音频系统提供了增强立体声响中立体声的性能。因此,通用多通道音频系统可应用于卫星或陆地的音频广播数字化等各个领域。
MPEG-2 Audio和MPEG-1 Audio标准都使用相同类型的编解码器。与MPEG-1 Audio相比,MPEG-2 Audio作了如下的扩充:
(1)增加了16 kHz、22.05 kHz和24 kHz取样品率。
(2)扩展了编码器的输出速率范围,由32-384 Kb/s 扩展至8-640 Kb/s。
(3)增加了声道数,支持5.1多声道编码(前中央C、前左L、前右R、环绕左LS、环绕右RS和低频增强LEF)和7.1声道的环绕声。“1”是指LEF(Low Frequency Effects) 声道。
MPEG-2 Audio与MPEG-1 Audio保持前向和后向兼容。前向兼容表示MPEG-2 Audio多声道解码器可以正确地对MPEG-1 Audio立体声码流进行解码,后向兼容表示一个MPEG-1立体声解码器在解码时,可以从多声道码流中恢复为双声道立体声信号。
MPEG-2还定义了一种声音数据压缩格式,称为MPEG-2 AAC(Advanced Audio Coding),是MPEG-2标准的第七部分(ISO/IEC 13818-7)。AAC意味着高级音频编码,是一个可以提供更高音频质量和多通道音频编码的标准。
二、AAC新编码方法的优势
从系统结构上看,AAC与MPEG-1 Layer Ⅲ是 类似的,但是AAC增加了一些新的重要的编码工具,使得AAC的编码效率得到较大提高。主要表现在:
①AAC采用改进的余弦变换MDCT滤波器组,这种变换有利于消除边界噪声,改善信号质量,并且MDCT窗的宽度增长到了1024,滤波器组的频率分辨率为2048。
②采用了新的时间/频率编码方案,即瞬时噪声定形(TNS, Temporal Noise Shaping)。TNS是用来控制量化噪声瞬时形状的一种方法,解决掩蔽域值和量化噪声的错误匹配问题。这种技术的主要优势在于,声音信号在频域、时域中均有一个瞬时尖峰,TNS使用这种双重性来扩展已知的预测编码技术,把量化噪声置于实际的信号之下以避免错误匹配。
③由于音频信号有较强的相关性,因此在AAC系统中采用预测编码技术,能有效地提高了预测编码效率。
④AAC能细致地控制量化步长大小,使得比特利用更为有效。
⑤在AAC系统中采用了霍夫曼编码,并配合灵活的码流结构,进一步提高了编码效率。
通过这些措施,使得AAC的压缩性能超过了以往的标准。与MPEG-1 LayerⅡ相比,AAC的压缩率可提高一倍,而且质量更高;与MPEG-1 LayerⅢ相比,在质量相同的条件下,数据率是它的70%。现在MPEG-2标准的应用越来越广泛,MPEG家族中MPEG-2作为消费类产品的音频、视频处理标准具有其独特的“魅力”,可以满足高质量图像的需求。
本文通过研究ISO/ IEC多通道音频编码系统,分析了音频编码原理和MPEG-2环绕声系统良好的兼容特性,提出了一种在低比特率下获得高品质多通道音频的有效压缩方法。通过应用该方法,得以实现在解码时不需要再现所有通道的声音,而是根据解码器的复杂程度得到相应的解码输出。
[参考文献]
[1]钟玉琢运动图像压缩编码国际标准及MPEG的新进展.北京:清华大学出版社,2002
[2]李冬梅MPEG视频编码中的码率控制原理及算法.电视技术-2003年1期
[3]方涛.数字电视业务信息及其编码.国防工业出版社.2003
(作者单位:三峡电力职业学院 湖北宜昌)
[关键词]MPEG 多通道音频 低比特率编码
由于Internet的迅猛发展和无线通信的普及,视频和音频压缩编码的目标也从传统的面向存储变为面向传输。MPEG组织颁布的MPEG-l(ISO/IEC 11172)标准主要是为数字媒介(DSM)中的视频、音频信息压缩而提出,被应用于CD—ROM、数字录音带(DAT)、计算机硬盘和CD-R、CD—RW等。新一代的视频压缩编码国际标准中的精细可扩展性(fine granular scalable FGS)编码提供了完全可扩展的增强层码流,它可以在任何地点截断,具有极强网络带宽适应能力。
一、ISO/ IEC通用多通道音频编码系统
MPEG-1系统编码层允许把一个或者多个基本流组合成单个流,它将来自每个基本流的数据经过多路复用后,和附带信息一起编码,从而允许基本流能实现同步重新播放。音频基本流的表示单元是一组与来自音频帧样本所对应的样本数据。以MPEG-1为例,仅使用Layer 其单声道的速率为 32-192Kb/s,立体声速率为64-384Kb/s;对MPEG-2而言,主体流与MPEG-1相同,扩展流的速率可达528Kb/s,加上主体流后的综合速率则高达912Kb/s。
单声道或者立体声音频信号的低比特率编码标准是由ISO/IEC 11172-3 中的MPEG-1 Audio建立的,可以应用于存储介质,或者应用于有限容量传输通道中与图像信息相关的高质量数字化音频信号。在仅需两个通道立体声时,ISO/IEC 11172-3 音频编码标准可以和MPEG-1及MPEG-2一起使用。MPEG-2 Audio(ISO/IEC 13818-3)提供了扩展到3/2多通道音频的能力和一个可选的低频增强通道(LFE)。在双声道音频系统中,通用多通道音频系统提供了增强立体声响中立体声的性能。因此,通用多通道音频系统可应用于卫星或陆地的音频广播数字化等各个领域。
MPEG-2 Audio和MPEG-1 Audio标准都使用相同类型的编解码器。与MPEG-1 Audio相比,MPEG-2 Audio作了如下的扩充:
(1)增加了16 kHz、22.05 kHz和24 kHz取样品率。
(2)扩展了编码器的输出速率范围,由32-384 Kb/s 扩展至8-640 Kb/s。
(3)增加了声道数,支持5.1多声道编码(前中央C、前左L、前右R、环绕左LS、环绕右RS和低频增强LEF)和7.1声道的环绕声。“1”是指LEF(Low Frequency Effects) 声道。
MPEG-2 Audio与MPEG-1 Audio保持前向和后向兼容。前向兼容表示MPEG-2 Audio多声道解码器可以正确地对MPEG-1 Audio立体声码流进行解码,后向兼容表示一个MPEG-1立体声解码器在解码时,可以从多声道码流中恢复为双声道立体声信号。
MPEG-2还定义了一种声音数据压缩格式,称为MPEG-2 AAC(Advanced Audio Coding),是MPEG-2标准的第七部分(ISO/IEC 13818-7)。AAC意味着高级音频编码,是一个可以提供更高音频质量和多通道音频编码的标准。
二、AAC新编码方法的优势
从系统结构上看,AAC与MPEG-1 Layer Ⅲ是 类似的,但是AAC增加了一些新的重要的编码工具,使得AAC的编码效率得到较大提高。主要表现在:
①AAC采用改进的余弦变换MDCT滤波器组,这种变换有利于消除边界噪声,改善信号质量,并且MDCT窗的宽度增长到了1024,滤波器组的频率分辨率为2048。
②采用了新的时间/频率编码方案,即瞬时噪声定形(TNS, Temporal Noise Shaping)。TNS是用来控制量化噪声瞬时形状的一种方法,解决掩蔽域值和量化噪声的错误匹配问题。这种技术的主要优势在于,声音信号在频域、时域中均有一个瞬时尖峰,TNS使用这种双重性来扩展已知的预测编码技术,把量化噪声置于实际的信号之下以避免错误匹配。
③由于音频信号有较强的相关性,因此在AAC系统中采用预测编码技术,能有效地提高了预测编码效率。
④AAC能细致地控制量化步长大小,使得比特利用更为有效。
⑤在AAC系统中采用了霍夫曼编码,并配合灵活的码流结构,进一步提高了编码效率。
通过这些措施,使得AAC的压缩性能超过了以往的标准。与MPEG-1 LayerⅡ相比,AAC的压缩率可提高一倍,而且质量更高;与MPEG-1 LayerⅢ相比,在质量相同的条件下,数据率是它的70%。现在MPEG-2标准的应用越来越广泛,MPEG家族中MPEG-2作为消费类产品的音频、视频处理标准具有其独特的“魅力”,可以满足高质量图像的需求。
本文通过研究ISO/ IEC多通道音频编码系统,分析了音频编码原理和MPEG-2环绕声系统良好的兼容特性,提出了一种在低比特率下获得高品质多通道音频的有效压缩方法。通过应用该方法,得以实现在解码时不需要再现所有通道的声音,而是根据解码器的复杂程度得到相应的解码输出。
[参考文献]
[1]钟玉琢运动图像压缩编码国际标准及MPEG的新进展.北京:清华大学出版社,2002
[2]李冬梅MPEG视频编码中的码率控制原理及算法.电视技术-2003年1期
[3]方涛.数字电视业务信息及其编码.国防工业出版社.2003
(作者单位:三峡电力职业学院 湖北宜昌)