论文部分内容阅读
[摘 要]Ogg Vorbis是一种新的数字音频压缩格式,其拥有相对于MP3更好的音质以及更佳的编码算法,可以在相对低的速率下实现比MP3更好的音质,它是完全免费的,有着很好的研究价值和发展前景。
[关键词]Ogg Vorbis 数字音频 编码
Ogg Vorbis是一种新的音频压缩格式,类似于MP3等现有的通过有损压缩算法进行音频压缩的音乐格式,它是完全免费、开放和没有专利限制的。Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的,现在创建的Ogg文件可以在未来的任何播放器上播放。
Ogg是一个庞大的多媒体开发计划的项目名称,由美国Xiph.org组织的涉及视频音频等方面的编码开发。Ogg是一种多媒体外层格式,它可以包含数字音频,也可以包含数字视频,而Vorbis则是Xiph.org开发的专用音频格式。整个Ogg项目计划的目的就是向任何人提供完全免费的多媒体编码方案。Ogg Vorbis主要的特点是:源码完全开放、无专利限制,具有较大编码灵活性。在高质量(高比特率)级别CD或DAT立体声,16/24bit(量化)时,与现有的MPEG-2和MPEG-4等音频算法相当。输出码率可设置为平均比特率(ABR)或可变比特率(VBR),范围为16~128 Kbps/ch,输入音频信号支持:采样率8~192 kHz;量化分辨率16~24 bit量化;声道数:单声道、立体声、4声道、5.1声道,最高可支持255独立声道。
1. Ogg Vorbis的编码
Ogg Vorbis设计成一个具有心理声学模型的复杂编码器,但解码运算复杂度低于MP3。没有提供帧格式、同步及错误保护等,仅仅是接收输入的音频数据块,并压缩成数据包方式。同其他的音频编码算法一样。Ogg Vorbis编码过程也是对时域信号采取加窗处理一帧一帧逐步进行,其中帧的大小分长帧(2048个采样值)和短帧(256个采样值),编码过程如下。首先对输入音频PCM信号进行稳态/瞬态分析,决定MCDT的长度;同时原始音频信号要进行FFT分析。两种变换的频谱系数输入给心理声学模型单元,MDCT系数用于噪声掩蔽计算,FFT结果用于音调掩蔽特性计算,共同构造总的掩蔽曲线。然后根据MDCT系数及掩蔽曲线,对频谱系数进行线性预测分析,用LPC(线性预测系数)表示频谱包络,即基底曲线;或通过线性分段逼进方式获得基底曲线。从MDCT系数中去掉频谱包络则得到白化的残差频谱,由于残差频谱动态方位明显变小,从而降低量化误差。之后主要采用声道耦合技术进一步降低冗余度,耦合主要是将左右声道数据从直角坐标映射到平方极坐标;最后对白化的残差信号有效的以矢量量化表示。最后将要传输的各种信息数据按Vorbis定义的包格式组装,形成Vorbis压缩码流。
2. Ogg Vorbis的解码
Ogg Vorbis的解码过程是其编码过程的逆过程,相对于编码过程,Vorbis的解码过程复杂度较低,非常便于硬件实时实现。从Ogg数据码流输入开始,Vorbis解码器从Ogg码流中逐页解码出一个个完整的Vorbis数据包,直至最后输出经重叠的累加重构的PCM数据。
3. Ogg Vorbis的优点和缺点
Ogg Vorbis作为一种新的音频编码格式,有它自己的优点和不足之处。优点主要有[2,3]:(1) 它的最大特点是使用了向前适应算法结构。在文件格式已经固定下来后还能对音质进行明显的调节和新算法。现在创建的Ogg文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。(2) 它的编码十分优秀,相对其他格式音质上有提升,特别在低比特率下有很好的表现力。这将是吸引很多人选择它的原因,因为它相对无疑提高了播放器的容量,而且有着更好的音质表现。而它的不足之处则在于:网络上Ogg的资源还相当的少,需要撼动MP3的霸主地位还需要很长的路要走。
参考文献:
[1] 阎建新,董在望,窦维蓓.Ogg Vorbis数字音频编码技术.电声技术,2003(9):7-11
[2] 姜丽莉,刘佩林.OggVorbis音频编码技术及其优化.电声技术,2005(12):48-50
[3] Ogg Vorbis Stereo-specific Channel Coupling Discussion: www.xiph.org/ogg/vorbis/doc/stereo.html
[关键词]Ogg Vorbis 数字音频 编码
Ogg Vorbis是一种新的音频压缩格式,类似于MP3等现有的通过有损压缩算法进行音频压缩的音乐格式,它是完全免费、开放和没有专利限制的。Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的,现在创建的Ogg文件可以在未来的任何播放器上播放。
Ogg是一个庞大的多媒体开发计划的项目名称,由美国Xiph.org组织的涉及视频音频等方面的编码开发。Ogg是一种多媒体外层格式,它可以包含数字音频,也可以包含数字视频,而Vorbis则是Xiph.org开发的专用音频格式。整个Ogg项目计划的目的就是向任何人提供完全免费的多媒体编码方案。Ogg Vorbis主要的特点是:源码完全开放、无专利限制,具有较大编码灵活性。在高质量(高比特率)级别CD或DAT立体声,16/24bit(量化)时,与现有的MPEG-2和MPEG-4等音频算法相当。输出码率可设置为平均比特率(ABR)或可变比特率(VBR),范围为16~128 Kbps/ch,输入音频信号支持:采样率8~192 kHz;量化分辨率16~24 bit量化;声道数:单声道、立体声、4声道、5.1声道,最高可支持255独立声道。
1. Ogg Vorbis的编码
Ogg Vorbis设计成一个具有心理声学模型的复杂编码器,但解码运算复杂度低于MP3。没有提供帧格式、同步及错误保护等,仅仅是接收输入的音频数据块,并压缩成数据包方式。同其他的音频编码算法一样。Ogg Vorbis编码过程也是对时域信号采取加窗处理一帧一帧逐步进行,其中帧的大小分长帧(2048个采样值)和短帧(256个采样值),编码过程如下。首先对输入音频PCM信号进行稳态/瞬态分析,决定MCDT的长度;同时原始音频信号要进行FFT分析。两种变换的频谱系数输入给心理声学模型单元,MDCT系数用于噪声掩蔽计算,FFT结果用于音调掩蔽特性计算,共同构造总的掩蔽曲线。然后根据MDCT系数及掩蔽曲线,对频谱系数进行线性预测分析,用LPC(线性预测系数)表示频谱包络,即基底曲线;或通过线性分段逼进方式获得基底曲线。从MDCT系数中去掉频谱包络则得到白化的残差频谱,由于残差频谱动态方位明显变小,从而降低量化误差。之后主要采用声道耦合技术进一步降低冗余度,耦合主要是将左右声道数据从直角坐标映射到平方极坐标;最后对白化的残差信号有效的以矢量量化表示。最后将要传输的各种信息数据按Vorbis定义的包格式组装,形成Vorbis压缩码流。
2. Ogg Vorbis的解码
Ogg Vorbis的解码过程是其编码过程的逆过程,相对于编码过程,Vorbis的解码过程复杂度较低,非常便于硬件实时实现。从Ogg数据码流输入开始,Vorbis解码器从Ogg码流中逐页解码出一个个完整的Vorbis数据包,直至最后输出经重叠的累加重构的PCM数据。
3. Ogg Vorbis的优点和缺点
Ogg Vorbis作为一种新的音频编码格式,有它自己的优点和不足之处。优点主要有[2,3]:(1) 它的最大特点是使用了向前适应算法结构。在文件格式已经固定下来后还能对音质进行明显的调节和新算法。现在创建的Ogg文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。(2) 它的编码十分优秀,相对其他格式音质上有提升,特别在低比特率下有很好的表现力。这将是吸引很多人选择它的原因,因为它相对无疑提高了播放器的容量,而且有着更好的音质表现。而它的不足之处则在于:网络上Ogg的资源还相当的少,需要撼动MP3的霸主地位还需要很长的路要走。
参考文献:
[1] 阎建新,董在望,窦维蓓.Ogg Vorbis数字音频编码技术.电声技术,2003(9):7-11
[2] 姜丽莉,刘佩林.OggVorbis音频编码技术及其优化.电声技术,2005(12):48-50
[3] Ogg Vorbis Stereo-specific Channel Coupling Discussion: www.xiph.org/ogg/vorbis/doc/stereo.html