自适应多速率宽带语音编码算法的仿真实现及研究

来源 :太原理工大学 | 被引量 : 11次 | 上传用户:saya1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了满足WCDMA和GSM对高质量语音业务的需求,3gpp/ETSI提出了宽带自适应多码率(AMR-WB)编解码器。随后,AMR-WB又被ITU-T选用为其16kbit/s宽带语音编码标准G.722.2。AMR-WB具有语音质量高、平均编码速率低和自适应好等优点,是通信史上第一种可以同时用于有线与无线业务的语音编码系统,在无线通讯领域和有线通讯领域都有着广阔的应用前景。本文首先对AMR-WB算法进行了系统的分析,深入研究了编码器的线性预测和量化、自适应码本搜索、固定码本搜索和高频带处理等几个模块以及解码器的解码原理。接着对算法进行了仿真实现,选用TIMIT标准英文语音数据库中的标准语音文件(16kHz,16bit)进行编解码实验,对编解码后的语音质量进行了主观听觉测试和客观PESQ测试,测试结果表明12.65kbit/s以上模式,合成语音的波形与原始语音基本一致,在听觉上已经与原始语音难以分辨,PESQ值都超过了4.0,6.60kbit/s和8.85kbit/s模式,在波形和听觉上稍有失真,PESQ值都在3.5以上,达到了通信质量标准,而且合成语音具有良好的自然度和听觉舒适性。本文还对三种宽带语音编码标准G.722、G.722.1及G.722.2(AMR-WB)分别进行了编解码测试,对三种算法的语音质量进行了测试比较,G.722.2(AMR-WB)中23.85kbit/s和23.05kbit/s两种模式的语音质量与G.722中的64kbit/s模式相当,G.722.2(AMR-WB)中的19.85kbit/s和18.25kbit/s两种模式的语音质量与G.722中的56kbit/s模式相当,而G.722.1中的32kbit/s模式只相当于G.722.2(AMR-WB)中的12.65kbit/s模式,显然G.722.2(AMR-WB)用较低的编码速率得到了较高的语音质量,相比G.722和G.722.1具有明显的优势。在AMR-WB中使用了一种修正的感觉加权滤波器,这种感觉加权滤波器不同于传统的窄带语音感觉加权滤波器,它可以与预加重结合起来,减小由于宽带语音信号低频到高频的动态范围大而引起的频谱倾斜,新的语音感觉加权滤波器的结构可以充分减少了共振峰的倾斜性。本文对这两种感觉加权滤波器进行了分析研究,并用标准宽带语音对两者的频率特性进行了测试比较,结果表明新的感觉加权滤波器具有良好的滤波特性,频率响应与宽带语音的谱包络对应良好,且较为平滑,动态范围小。
其他文献
Contourlet变换是一种新的“真正”的二维图像表示方法,具有多分辨率、多方向、时频局部和各向异性等特点,在图像处理领域有着广泛的应用前景。但Contourlet变换不具有平移不
利用航拍图像序列对地面目标进行三维重建在军事侦查、导航、测绘、目标识别等领域具有重要价值。立体视觉是计算机视觉的一个比较重要领域,合成孔径视觉处理利用全部图像序
随着现代通信技术的发展,人们对数据通信的服务质量要求越来越高,如何在高速传输的过程中保持通信系统的可靠性,减少系统传输时信息的错误概率一直是研究的热点,而信道编码技
几何信息模型是实现多学科协同仿真的基础。STL模型(一种三角形物面网格模型)具有数据结构简单并且与三维CAD系统无关的优点,已经成为多学科仿真采用的主要几何信息模型之一。
随着通信技术的迅速发展,传统电视逐步向着数字化、网络化、智能化的方向前进。为了满足人们的需求,机顶盒应运而生。从本质上说,机顶盒也是嵌入式系统,包括硬件部分和软件部
网络数据是分层处理的,数据的语义信息存在于网络体系结构的每一层中。基于这一思想,提出了一种网络数据多层语义描述方法。将网络数据语义分为弱、中、强三个语义域,不仅描述其
无源接收机用来对付现代电子战场上的各种威胁,能够可靠地截获雷达辐射信号,提取信号特征,为验证飞机射频隐身性能提供了有效的手段。传统的模拟接收机已经无法应对不同功率
合成孔径雷达地面动目标指示(SAR/GMTI)作为SAR技术的扩展,在军事、民用领域均占有重要的地位。其中,多通道处理技术由于引入了额外的空间自由度,有效地降低了系统的最小可检
自九十年代出现以来,信息隐藏引起了信息安全领域研究者们的极大关注。它可以将特定的信息(如版权信息、秘密消息等)嵌入到图像、音频、视频及文本文件等各种数字媒体中,起到
无线信道的广播特性导致了越来越多的信息安全问题。传统上,由上层的加密机制来保证无线通信的安全。但是,随着窃听技术的发展,加密变得越来越复杂,这给通信双方带来了极大的