论文部分内容阅读
采用更宽的带宽和更高的采样频率可以提高语音编码质量,能够为用户提供更舒适的听觉体验。由于SILK既能够提供宽带变速率语音编码,也能够在低带宽的环境中提供较优质的通话质量,因此SILK的应用前景被广泛关注。设计出一种基于SILK的宽带变速率高质量的语音编码器,并将其应用于实时语音通信环境,具有重要的研究意义和应用价值,其关键算法的研究和编码性能的进一步提升是本文研究的重点。由于SILK多用于以互联网为传输承载的网络电话(Voice over Internet Protocol,VoIP)中,而互联网只提供一种尽力而为的服务,常常由于网路延时、拥塞和错误传播等原因造成语音数据包丢失,严重影响了接收端的语音质量。为了有效解决VoIP中的丢包问题,本文在研究基于SILK宽带变速率语音编码器的丢包处理技术的基础上,提出了一种将内插法(Interpolation)和本文所提的改进型低比特冗余编码(Improved Low Bit Rate Redundancy,ILBRR)算法相结合的丢包处理算法(简称I-ILBRR算法)。并测试了在不同丢包率下,采用该算法的SILK和标准SILK编码器合成语音的质量。实验结果表明,采用I-ILBRR算法的SILK编码器容错能力更强。由于采用I-ILBRR算法会增加SILK语音编码器的平均编码速率,为了提高SILK的编码效率,本文对输入语音信号进行模拟,并提出了一种预测噪声整形量化(Predictive Noise Shaping Quantizer,PNSQ)算法,以此达到降低编码比特率的目的。首先,在输入语音信号中添加特定噪声,使得编码端生成一种可以和频谱特征相匹配的模拟信号,然后对该模拟信号进行长时预测和短时预测,提高预测滤波器的预测增益,减少量化索引的熵,从而减少传输编码语音信号所需的比特数。其次,在SILK编码器中采用PNSQ算法,既不需要额外的边带信息,也不用改变比特流格式,能提高编码效率。测试结果表明,本文所提算法在保证合成语音质量基本不变的前提下,平均编码比特率降低了1.5223 kbps。