论文部分内容阅读
语音编码是现代通信网络中最基本的内容之一。为了满足通信领域众多的需求,2.4kbps及以下的低速率语音编码技术一直是十分重要的研究课题。尤其在某些带宽非常受限的应用领域,更是迫切需要一些更低速率(如0.6-0.3kbps)的语音编码技术。语音信号可以通过线性预测技术分解为LP系数以及余量信号。LP系数通常转换为与其等价的LSF参数进行量化,它占据语音码流中的大部分,因而其高效量化方式将是超低速率声码器的关键研究内容。本课题首先针对分段声码器的语音分段算法做了详细的研究,提出了一种能够实时运行的较为高效、可靠的语音分段算法,并作为之后新提出的矢量量化算法以及超低速率声码器的重要工具。接着本课题结合新的语音分段算法,设计了一种分段预测多级矢量量化算法,根据LSF参数在段内强相关以及在段间弱相关的特性,将矢量预测器分为段内预测器与段间预测器两种,更合理地利用了LSF参数的帧间相关性,比起普通的预测多级矢量量化算法,新算法的量化精度有了明显的提升。之后,本课题又设计了一种码书联合优化训练算法,使量化器、段内预测器、段间预测器能够联合迭代更新,优化后的码书对于LSF参数的量化性能又进一步获得提升。最后本课题结合以上新算法与正弦激励参数模型,对输入语音的LP(LSF)参数以及余量信号进行编解码并重构原始语音,从而设计了一款平均速率约0.4kbps的超低速率声码器,其重构语音的音质达到了可懂的级别。