论文部分内容阅读
人类通信中最基本也是最重要的方式便是语音通信,但是在进行语音通信过程中,由于语音本身存在的冗余性,使得信息的传递与存储面临诸多问题。因此用来解决现代语音通信中存在的带宽、传输可靠性、抗噪声性之间矛盾的低速率甚至超低速率的语音压缩技术由于具有深刻的现实意义而成为研究的热点。将语音信号分为清音和浊音,分别选择不同的激励源来合成语音能够有效地模拟原始语音的周期性;根据语音信号的频率将其划分为若干子带,不同子带分别进行清浊音的划分,能够更精确地确定语音信号的清浊音信息;由正弦激励模型作为浊音的激励源,不仅描述了语音的周期特性也可以对语音信号的幅度特性进行描述,从而使得合成语音清晰可懂。由清华大学所提出的正弦激励线性预测(Sinusoidal Excitation Linear Prediction)算法兼具上述语音编码技术优势,使得其能在低编码速率的基础上很好的模拟自然语言,合成的语音质量较高。SELP算法由于上述特点成为最有潜力的算法之一而被广泛研究。本论文首先深入学习了SELP语音压缩算法采用的各项技术,详细讲解了SELP算法编码过程中每个参数的提取和量化的具体方法,以及解码中的语音合成过程。在此基础之上采用增加帧长、多帧联合帧内参数插值等技术设计实现了1.2Kb/s SELP算法,并在PC机上基于开源MELP代码,用C语言实现2.4Kb/s及1.2Kb/s SELP算法。将合成语音与原始语音在时域与频域进行比较,并用平均满意度(Mean Opinion Score)方法对合成质量进行评价,基本达到通信要求。