论文部分内容阅读
本篇论文首先阐述了波形内插编码技术的原理和结构。WI编码器按帧处理语音信号,它在分析端提取语音的基音周期参数,然后利用内插求取各特征波抽取点的瞬时基音值,并以此值作为该抽取点上瞬时特征波的长度,从语音信号或残差信号中抽取特征波。得到的特征波经对齐和归一化后,与基音周期、特征波增益等一并作为分析部分的输出参数发送至合成端。在合成部分,首先内插求取所有的瞬时特征波,然后利用基音周期求取相位值并最终还原语音或残差信号。
本文在已有技术的基础上,针对WI编码方法在色噪声环境、倍基音、清浊音过渡段等方面存在的问题,从特征波提取域的选择,白噪声和有色噪声下基音周期的准确估计,基音周期的内插、特征波的可变抽取点,基音倍频下特征波的对齐、滤波及内插等方面作了改进,并提出了色噪声白化处理,利用非线性内插和分析合成求取瞬时基音值,特征波三段式的对齐、滤波和内插等方案。
所有的处理过程通过C程序在计算机上进行模拟。实验结果表明,改进方案在噪声环境下依旧能取得较好的效果。与其它参数或混合编码方法相比较,WI编码的重构语音也明显具有较高的自然度与可懂度。