论文部分内容阅读
语音编码的目的是在保持一定的算法复杂程度和通信时延的前提下,占用尽可能少的通信容量,传送尽可能高质量的语音。多媒体通信的发展,使得宽带十分宝贵,因而需要高质量的低码率语音编码。在低码率语音编码领域,波形内插(WI)语音编码作为混合编码的一员,算法性能优良,被称作是最具潜力的编码算法之一。
本文以特征波形内插(Characteristic Waveform Interpolation,CWI)模型为依托,对该编码方法中的关键技术诸如特征波形分解、相关参数的量化等进行了研究,最终提出了一种基于双正交提升小波变换分解的1.7Kbps特征波形内插(BLWT-CWI)语音编码算法。
本文的主要工作和创新如下:
一、针对特征波形CW维数过高的问题,提出了一种对CW进行分类的算法,以提高分解精度和量化效果,降低计算复杂度和空间消耗度。该方法是根据该帧特征波形的8个子帧中最大基音周期的长度来划分的,将CW分成四类。基于此,本文对CW的量化,也采用上述分类的方法,即对每一种类型设计出一个相应的码书,并进行相应的量化
二、为了进一步压缩帧间冗余的信息,提高量化效率,降低编码速率,本文采用两帧联合矢量量化方法来量化LSF、基音周期和功率。根据LSF参数的帧内和帧间相关性,提出了两帧联合预测多级分裂矢量量化方法。该算法是用当前超帧和上一超帧中第二帧的LSF频率来预测当前超帧的LSF参数,预测后,对预测残差矢量采用多级分裂矢量量化方法。并将此量化方案与预测式瞬时联合多级分裂矢量量化方案进行了比较。
三、本文构建了1.7Kbps的BLWT-WI语音编码器。MOS分测试结果表明,1.7KbpsBLWT-CWI和2.32KbpsBLWT-CWI两种编码算法的语音编码质量非常相似,后者略优于前者;主观A/B测试结果表明,对于所有语音而言1.7K.bpsBLWT-CWI语音编码算法的重建语音质量与2.4KbpsMELP编码算法基本一致。而从语音信号重建波形的比较中发现此编码算法对男声信号编码重建的质量比对女声信号要好。