论文部分内容阅读
语音转换是语音处理技术的一个重要分支,是近年的研究热点,对语音信号处理的其他领域有着积极地推动作用。基于个性特征的语音转换是提取源-目标说话人语音的个性特征参数进行训练,根据训练规则对其转换,使转换后语音更逼近目标语音。语音转换技术的应用非常广泛,如文本语音合成(TTS)系统、语音识别、医疗领域及通信领域。语音转换的研究具有巨大的理论和应用价值。论文主要工作包括以下几方面内容:1、对语音产生机理、数字模型以及语音信号分析方法进行了讨论;阐述了影响说话人差异的个性特征参数,并通过语音转换原理给出了转换系统的结构。2、针对传统基频参数提取的不足,提出了改进的基于小波变换的LP-CEP的基频提取算法。为语音的韵律转换提供了更精确的基频参数。通过线性预测模型提取反应语音信号谱包络的LSF参数。3、针对传统高斯混合模型对语音的谱包络转换过于平滑的问题,通过改进的高斯混合模型对语音的谱包络参数进行了转换。采用三层BP网络实现语音的基频曲线转换,通过BP训练得到源-目标语音基频参数曲线的映射权值,然后对进行相应的转换。将转换后的频谱包络参数与基频参数曲线进行语音的合成。4、通过MATLAB对语音转换进行仿真实验并分析结果,根据主观和客观评价标准测评转换后的语音效果。通过对比分析,本文算法实现的语音转换得到了很好的转换效果,转换后语音更接近于目标语音。