语音转换的关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:lollipop7919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是要改变一个说话人的语音,使之听起来象是另外一个人的语音。语音转换是语音信号处理领域的一个较新的分支,具有很重要的理论价值和实用价值。语音转换用于文-语转换系统中,可以容易地合成出不同说话人个性特征的语音;它也可以用于电影配音、极低速率语音编码、语音通信的说话人加密、语音的说话人模拟等。语音转换的研究对语音分析、语音编码、语音合成、语音增强、语音识别、说话人识别等语音信号处理的其它各个领域有重要的促进作用。本文主要围绕语音转换中的基音周期变换和谱包络转换两项关键技术进行研究,研究了基于小语料库训练的语音转换系统。 对基音周期变换方法的研究:在基于宽带TD-PSOLA基音周期变换方法的研究中,发现分析窗长取源语音和目标语音两者较小基音周期两倍的效果优于取两者较大基音周期两倍的效果,对其原因进行了分析研究。FD-PSOLA中的压缩-扩展法在进行基音周期变换时,会引起相位谱压缩或扩展现象,从而使相位变化率发生变化,这会引起基音周期变换后语音的失真,为克服相位变化率的变化,我们提出分段线性相位建模方法,基于该相位模型在频域通过压缩-扩展法进行基音周期变换时,可以保证各谐波处的相位变化率近似不变;对每一帧进行处理后的语音信号帧中心不会发生漂移,而且与原语音波形更加接近,从而提高基音周期变换语音质量。FD-PSOLA中压缩-扩展法在进行基音周期变换时,不仅会引起相位的变化率发生变化,也会引起基频谐波的压缩-扩展现象,这同样是不合理的,会引起基音周期变换后语音质量的下降;为此,我们提出伪谐波语音分析-合成模型;基于该语音模型在进行基频变换时可以保证各基频谐波结构不发生压缩-扩展现象,从而高质量的实现基音周期变换,基于该模型也可以很方便的实现时长和能量的变换。 对频谱包络表示相关问题的研究:基于时域信号求解自相关方程是计算LPC系数的传统方法,当LPC阶数较低时得到的LPC谱包络平滑但不够准确,而当LPC阶数较高时,女声语音的LPC谱包络易受基频谐波影响且常比较尖锐,而基于语音信号的幅度谱包络求解得到的LPC系数能比较好的克服这一缺点。对LPC参数与LSF参数相互转换进行研究,推导出几种不同的由LPC参数求解LSF参数的方法。基于幅度谱包络求得的倒谱谱包络较基于幅度谱求得的谱包络更加准确,在此基础上,提出基于Mel尺度拉伸阶梯谱包络求解MFCC参数的方法,该方法求解简单,性能稳定,得到的MFCC-线性谱包络能非常准确的表示低频处的谱包络。 对谱包络转换方法的研究:研究了目前报道的各种谱包络转换实现方法,着重研究基于双线性函数来进行谱包络转换。基于双线性函数进行谱包络转换,具有转换参数少(只有一个)、易保持系统稳定等优良特性,特别适合小词汇量训练的语音转换系统;研究了基于求解频谱搬移系统单位冲击响应的方法;提出两种求解频谱搬移后LPC系数的方法;提出基于DFT分析和LPCC谱包络进行谱包络变换方法,并提出三种求解频谱搬移后LPCC谱包络的算法;提出基于DFT分析和DCT倒谱包络进行谱包络变换方法,并提出三种求解频谱搬移后DCT倒谱包络的算法;提出通过训练得到转换参数的方法。 对频谱倾斜补偿的研究:频谱倾斜也是语音信号的一个重要个性特征,研究利用临界倾斜滤波器的两个函数进行频谱倾斜补偿,并研究了通过训练自动提取频谱倾斜补偿参数的方法。频谱倾斜补偿可以比较有效的弥补双线性函数不能改变频谱幅度的缺点,使得到的转换谱包络更加准确。
其他文献
茶树(Camellia sinensis(L.)O.Kuntze)是我国重要的经济作物之一,不仅栽培历史悠久,而且分布广泛。已有研究表明,我国西南部是茶树的起源中心,孕育了丰富的茶树种质资源,其遗传多样
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
在分析黔南少数民族传统体育传承与发展现状的基础上,提出应从以下几个方面促进黔南少数民族传统体育的传承与发展:第一,深入分析找准黔南少数民族传统体育的文化特征和功能,
本文通过研究平面信号交叉路口的交通流特性,建立一种离散交通信号控制模型。此模型以交叉路口各方向车流支路为基本单元,把一个周期时间离散成许多相等的时间段,以各支路车
随着用户对敏捷移动机器人要求的不断提高,移动机器人与智能监控、智慧运动的结合越来越紧密。单独采用单片机难以满足上述智能化、智慧化的需求,而种类丰富的传感器和高度集
物理实验的教学离不开创新,“创新是一个民族的灵魂,是一个国家兴旺发达的不竭动力。”因此,我在教学实践中对物理实验教学的设计与实施进行了有益的探索,并形成了一些初步认识。
在现代工业尤其是化学工业过程中,某一单元发生重大火灾、爆炸事故可能会导致邻近的单元发生二级或更高级的事故,这种现象即为重大事故的多米诺效应。重大事故多米诺效应属于低
目的:通过血清过敏原的检测分析哮喘患者过敏原与年龄、性别、体重指数(Body Mass Index,BMI)、过敏性疾病家族史、肺功能、空气污染的关系,探讨太原及周边地区支气管哮喘患