论文部分内容阅读
随着计算机技术和信息技术的飞速发展,语音合成技术已成为广大科研工作者关注的热点。线性预测(LPC)参数合成法以其数据率低、复杂度低、成本低、简单直观等特点在语音合成中受到特别的重视。但是由于原有模型所提取的参数过于简单,使得在合成阶段很难得到高质量的合成语音。自适应多速率的宽带语音编码技术(AMR-WB)是一种高品质的数字宽带语音编码系统,采用代数码激励线性预测(ACELP)技术,将传统的200-3400Hz的带宽扩展到50-7000Hz,在参数提取阶段运用闭环和开环相结合的方法计算基音延时,运用自适应码本和固定码本结合的方式还原激励,使合成的语音效果显著提高,该技术为改善LPC参数语音合成效果提供了解决思路。本文在深入研究AMR-WB编解码算法原理的基础上,设计出基于AMR-WB的汉语文语转换实验系统。在参数提取阶段,输入带宽7k、采样频率16kHz、采样精度16位的语音信号,相对于传统LPC算法的输入信号具有更高的语音精度。算法运用闭环搜索和开环搜索相结合的方法来计算基音周期,运用自适应码本和固定码本结合的方式还原激励,弥补传统LPC算法的不足,使合成的语音效果显著提高。为了提高参数提取工作的效率,本文制作了PCM编码转化程序。在合成阶段,根据文语转换系统的需要,考虑汉字和标点符号的输入形式,设计出能够根据控制命令得到女声或男声的输出结果,并用一段空白语音来体现标点符号信息的合成程序。利用MATLAB软件对合成结果进行仿真,结果表明,合成语音很好地体现了语音样本的幅频特性,具有较高的合成质量;通过算法复杂度分析,证明本文所采用的改进算法是符合要求的。因此,AMR-WB作为改善LPC参数语音合成效果的改进算法是切实可行的。