论文部分内容阅读
语音信号在网络上进行传输,当出现信道负荷增大,带宽减少等情况时,容易出现丢包,抖动,延时,这样降低了语音质量;提升编码器对语音信号的编码性能很有必要。语音编码的主要目的是在适当减少复杂度和通信时延的条件下,尽可能占用较少的通信容量,提高传输过程中语音的质量。为了对传输过程中的差错具有较高鲁棒性和保证语音质量的同时,降低编码速率,节约宽带资源,提出了很多语音编解码算法,如:G.729、AMR、EVRC和iLBC等以及对这些算法的改进。其中iLBC(internet Low Bit codec)采用的是基于帧的线性预测编码技术,相比于其它编解码算法,该编码器具有动态码本更新技术、丢包隐藏技术和语音增强等技术。该语音编解码算法在基于IP的分组交换网络中具有很好的性能,当网络环境较差时仍可以提供高质量的语音服务。然而,iLBC在数据处理速率方面灵活性并不高,在处理丢包时,相比于码激励线性预测模型的编解码器会占用较高的比特率,这样增加了网络负荷,造成时延。针对上述问题,本文研究了基于iLBC扩展的多速率语音编解码算法,主要工作如下:详细介绍了一些扩展编码器的原理,分析了这些编码算法重构语音的质量。然后阐述iLBC的基本流程,继而在标准的iLBC编码器上进行改进。首先根据离散余弦变换较高的能量压缩特性,需要较少的比特数就能描述起始状态的特征,因此对语音信号中的起始状态采用频域的离散余弦变化来代替时域上的标量量化。然后为了减缓发送端的编码器对语音信号编码时出现丢包,而对语音质量造成的影响,在前面的步骤上增加了反馈调节模块,对语音的质量进行实时调整。最后,为了使编码器能支持音质较高的音频信号,在窄带的基础上增加了宽带编码模块,该方法主要是基于层的比特流进行处理,并对窄带和宽带编码流程进行了详细的描述。通过仿真实验,与经典的语音编解码算法相比较,模拟在不同丢包率和编码速率下各自的性能,本文算法处理后的语音信号更自然并且可懂性也较高。