论文部分内容阅读
本论文为响应ITU提出的LD-CELP编码算法新指标(延迟低于5毫秒,速率低于8Kb/s,长话音质)开展研究。主要研究目标为:1.设计并提出在长话音质下延迟2.5毫秒(帧长20样点)码率接近8Kb/s算法;2.设计并提出在通信质量下延迟5毫秒(帧长40样点)码率接近6Kb/s算法。为实现上述目标,论文在以下五个方面开展研究并取得创新性的进展。第一,提出了一种不依赖量化信噪比评价增益滤波器性能的方法,可在增益量化之前直接比较评价增益预测器的各种优化方案,形成了增益预测器与增益量化器分别独立进行优化的方法。研究评价了多个不同的预测器方案后发现有限记忆递推滤波器性能最高;而神经网络滤波器以最低计算代价获得了优于G.728杜宾递推公式的性能。对增益量化,研究比较了固定量化与自适应量化的特性。自适应量化的主要难点是自适应步长因子的优化涉及到海量运算。提出了一种基于人工免疫原理的克隆思维进化算法:N-进制编码方法,用来优化复杂目标函数多个变量,为解决这一问题贡献了一个新的方案。本研究的第二个创新性贡献是利用小波分析工具开发出语音信号后向实时基音检测算法。现有基音检测都是宽延迟的前向算法,包括G.728标准在内的所有低延迟语音编码算法均无基音检测过程。本研究基于小波分析提出了后向实时基音检测算法,可在2.5ms(20样点)帧内监测到基音脉冲的出现并计算出基音周期。在本研究领域,首次使基音分析用于低延迟语音编码算法成为可能。研究工作的第三个创新结果是在低延迟语音编码算法中引入自适应码书搜索。低延迟算法每样点少于1bit码率资源,使用自适应码书搜索不利于降低码率。本研究提出新的解决方案是:先利用实时后向基音检测算法对最佳自适应码字标号进行初步定位,然后以此为基准进行自适应码书的修正搜索。一方面降低了自适应码书的码率消耗,另一方面改善了实时后向基音检测算法的精度,用在低延迟语音编码算法中取得理想的效果。第四,在前面工作的基础上给出了延迟2.5毫秒(帧长20样点)8Kb/s算法。首先基于G.728的结构将帧长由5样点提高到20样点,通过大量反复实验表明,当码率降到8.8K/s以下时音质无法得到保证,计算复杂性也大大超过了实时性要求,必须使用与现有任何算法不同的新结构。研究并提出了三种延迟2.5毫秒的8Kb/s算法:方案1:自适应码书、固定码书各10bit(其中增益3bit,波形7bit)。方案2:偶数帧搜索自适应码书,奇数帧使用偶数帧的搜索结果,节省的码率资源用来扩大固定码书尺寸。方案3:结合后向实时基音检测的自适应码书搜索方案。实验表明,三种延迟2.5毫秒的8Kb/s算法编码质量都接近了长话音质,计算复杂性与G.728相当。最后讨论了进一步降低码率的情况。与其它后向编码算法不同,本研究采用代数码激励作固定码书,设计并提出了延迟40样点(5ms)的后向实时基音检测结合自适应码书修正搜索的编码方案,在6.2K/s码率时仍能保持通信质量。