论文部分内容阅读
为了满足WCDMA和GSM对高质量语音业务的需求,3gpp/ETSI提出了宽带自适应多码率(AMR-WB)编解码器。随后,AMR-WB又被ITU-T选用为其16kbit/s宽带语音编码标准G.722.2。AMR-WB具有语音质量高、平均编码速率低和自适应好等优点,是通信史上第一种可以同时用于有线与无线业务的语音编码系统,在无线通讯领域和有线通讯领域都有着广阔的应用前景。本文首先对AMR-WB算法进行了系统的分析,深入研究了编码器的线性预测和量化、自适应码本搜索、固定码本搜索和高频带处理等几个模块以及解码器的解码原理。接着对算法进行了仿真实现,选用TIMIT标准英文语音数据库中的标准语音文件(16kHz,16bit)进行编解码实验,对编解码后的语音质量进行了主观听觉测试和客观PESQ测试,测试结果表明12.65kbit/s以上模式,合成语音的波形与原始语音基本一致,在听觉上已经与原始语音难以分辨,PESQ值都超过了4.0,6.60kbit/s和8.85kbit/s模式,在波形和听觉上稍有失真,PESQ值都在3.5以上,达到了通信质量标准,而且合成语音具有良好的自然度和听觉舒适性。本文还对三种宽带语音编码标准G.722、G.722.1及G.722.2(AMR-WB)分别进行了编解码测试,对三种算法的语音质量进行了测试比较,G.722.2(AMR-WB)中23.85kbit/s和23.05kbit/s两种模式的语音质量与G.722中的64kbit/s模式相当,G.722.2(AMR-WB)中的19.85kbit/s和18.25kbit/s两种模式的语音质量与G.722中的56kbit/s模式相当,而G.722.1中的32kbit/s模式只相当于G.722.2(AMR-WB)中的12.65kbit/s模式,显然G.722.2(AMR-WB)用较低的编码速率得到了较高的语音质量,相比G.722和G.722.1具有明显的优势。在AMR-WB中使用了一种修正的感觉加权滤波器,这种感觉加权滤波器不同于传统的窄带语音感觉加权滤波器,它可以与预加重结合起来,减小由于宽带语音信号低频到高频的动态范围大而引起的频谱倾斜,新的语音感觉加权滤波器的结构可以充分减少了共振峰的倾斜性。本文对这两种感觉加权滤波器进行了分析研究,并用标准宽带语音对两者的频率特性进行了测试比较,结果表明新的感觉加权滤波器具有良好的滤波特性,频率响应与宽带语音的谱包络对应良好,且较为平滑,动态范围小。