【摘 要】
:
语音转换技术实现的是两个不同说话人声音个性特征之间的转换,即通过改变源语音的声学特征使之具有目标语音的声学特征,同时保留语义信息不变。语音转换技术可以提供个性化语
论文部分内容阅读
语音转换技术实现的是两个不同说话人声音个性特征之间的转换,即通过改变源语音的声学特征使之具有目标语音的声学特征,同时保留语义信息不变。语音转换技术可以提供个性化语音,用于文语转换终端,辅助医疗完善病人声音,丰富智能化人机交互等。另外,语音转换技术的研究有助于推动语音信号处理其它领域的不断发展,比如提高语音合成质量,降低说话人辨识难度等。所以,语音转换具有深远的应用前景和较大的理论研究价值。基于AHOcoder语音声码器及GMM模型的语音转换,主要工作如下:首先,从语音产生原理入手,描述发音系统的数学模型及常用的语音特征参数,分析特征参数对语音产生的影响,并对语音转换模型进行介绍。给出用于语音分解、特征参数提取与合成的AHOcoder语音声码器,该声码器可将语音信号分解并提取出对数基频、梅尔频率倒谱系数等参数并在转换之后基于特征参数进行语音合成。其次,重点研究基于AHOcoder语音声码器和GMM的语音转换系统。为了改善GMM造成的转换语音质量下降问题,加入双线性频率弯折训练,提高转换语音的质量。实验过程中发现时长不同会对语音转换效果造成一定的影响,于是利用均值方差法求出源语音与目标语音对应的时长调整因子,并结合时域叠加法对源语音时长进行调整,调整后的转换语音更接近目标语音。最后,针对GMM的过平滑现象进一步进行谱包络补偿,提出在GMM和双线性频率弯折训练的基础上加入全局方差的方法。仿真实验表明,谱包络补偿方法减小了转换语音与目标语音间的MFCC谱距离,改善了语音转换的效果,使得转换语音的质量进一步提高。
其他文献
当前各级团组织和团干部存在着一定程度的行政化、机关化、贵族化和娱乐化等作风问题,而共青团在对青年进行政治引导、思想引领、活动吸引、服务凝聚等方面存在不足,共青团面
中国已进入城市化、工业化快速发展阶段,城乡社会经济发生了剧烈变动,土地作为一切人类社会发展活动的载体,更驱动城乡土地利用的根本性变革,土地利用配置和管理直接影响着社
为保证正确性,并发程序的执行过程中必须保证存在一致性关系的共享变量得到原子性执行。若对存在一致性关系的共享变量的访问语句与其他线程中的语句产生预期之外的交织,且执
军用光电系统的研发管理面临着复杂的发展环境。军用光电系统是市场急需的高技术产品,装备信息化发展要求加剧了该领域的竞争形势。军工科研部门的传统组织结构,使得传统职能
近年来,随着我国经济的持续快速的发展,企业之间的海外收购案例越来越多。我国大型食品企业积极地谋求国际化的发展,已经成为企业发展的必然选择。企业通过与国际企业的联盟和收购,拓展海外市场,谋求更大的市场份额也成为我国大型企业发展的基本趋势。文献研究表明,国内的大型食品企业收购的意愿强,数量多,但质量并不高,成功与失败各占一半。究其原因,主要是影响收购与兼并因素比较复杂,既要把握宏观和微观的因素:如政治
在我国,医药卫生事业的发展跟我们日常生活息息相关,它维系着亿万群众的身体健康,说小了它关系着无数家庭的幸福状况,往大说它是重大民生的问题,是实现我国社会主义伟大复兴很重要的环节。近几年,国家新一轮的医改作出重要指示,继续在党的领导下深化医药卫生体制改革,明确未来要加快医药卫生事业发展步伐,让医药生产力适应人民群众日益增长的医药卫生需求。贯彻落实科学发展观、不断的提高人民群众身体健康,是促进我国经济
信息技术、互联网与计算机等技术建构的网络空间成为与现实社会空间并存的第二空间。但网络空间不是一成不变的,而是在技术发展中不断演进的。随着大数据技术在互联网领域应
在二十世纪,许多西方文学流派不断涌现在文坛,壮大发展,又退出文坛,如此以往,前仆后继。罗曼·加里,一位长着长长的鹰钩鼻的男人,身兼多职—二战时期的飞行员,外交官,电影导
金融危机后,美国制造业一度出现强劲增长,长期以来的“去工业化”似乎有停止的态势。此外,金融危机的爆发,也使美国意识到过度依赖虚拟经济增长而忽视制造业发展的弊端。2009
食品安全作为事关公众健康的重大公共卫生问题,已成为全社会的共识。现阶段公众对食品安全期待日益提高与食品安全风险隐患依然严峻的矛盾日益突出。在食品安全上升为国家战