论文部分内容阅读
提出并实现了一种基于STRAIGHT模型的、合成语音质量较高的语音转换系统.一方面STRAIGHT模型可以对语音的基频、时长等参数进行较大幅度的修改而不引起合成语音质量的下降,另一方面引入“预测”谱参数的概念.利用搜索预测码书的方法进行转换,既避免了经典系统中GMM模型谱参数估计的过平滑问题,又克服了经典系统基于LPC模型合成语音时,在帧与帧连接处会产生较大脉冲波形的缺点.语谱图分析、ABX测试和MOS分评价结果表明:提出的语音转换算法在合成语音质量和目标说话人特征映射上都远远好于经典的基于LPC模型的GMM转换系统.