基于深度学习的蒙古语语音转换系统

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:Engineer7002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着个性化语音合成技术的日渐成熟和人机交互的多样性发展,语音转换技术一直受到国内外研究者的关注。语音转换技术是指在语音内容不变的前提下,将源说话人的语音转换成目标说话人语音的一种特殊语音合成技术,可应用在语音合成系统的后端,生成多样的个性化语音合成效果。近年来,面向汉语、英语等主流语言的语音转换技术已经取得了很大的进展,但是面向蒙古语的语音转换技术还没有相关的研究成果。本文利用深度学习技术对蒙古语语音转换技术中展开研究。首先,本文借鉴汉语、英语等主流语言的语音转换技术的基本原理和模型架构,研究基于注意力机制的编码器-解码器(Encoder-Decoder)结构的蒙古语语音转换模型,实现了将源语音的声学参数直接映射为目标语音声学参数的端到端蒙古语语音转换技术。为了验证该模型的有效性,本文同时搭建了基于深度双向长短期记忆网络(DBLSTM)的蒙古语语音转换模型,并进行了相应的客观评价和主观评价。客观评价表明基于编码器-解码器(Encoder-Decoder)结构的蒙古语语音转换模型可以更好地拟合真实目标语音的声学参数,主观评价表明基于编码器-解码器(Encoder-Decoder)结构的蒙古语语音转换模型生成的目标语音具有更高的主观平均意见分(MOS),具有更好的自然度和连续性。此外,本文基于实验中得到的最优蒙古语语音转换模型搭建了蒙古语语音转换系统。系统的主要功能是将成年女性的源说话人语音转换为女童的目标语音,并实现了朗读源语音,下载转换后语音,调节语音语速,调节音量,暂停播放等辅助功能。最后对蒙古语语音转换系统进行功能测试及压力测试,测试表现符合预期结果。
其他文献
随着信息化进程和互联网的快速发展,大型企事业单位陆续启用或开发办公自动化产品来提高企业的管理效率。高速公路综合管理平台开发的目的也是利用互联网技术提高高速公路运
最近几年我国不断提出"体育强国"的理念,其直接结果是不断提升的我国篮球运动员数量,特别是高校的篮球运动员的数量,不断攀升。"篮球意识"是篮球运动中的灵魂所在,只有加强培
背景结核病(Tuberculosis,TB)是严重的、广泛传播的疾病之一,仍是一个重要的公共卫生问题,尤其是在发展中国家,其真正的发病率及患病率从未统计过。近年来随着艾滋病患病的增长,结核
建筑能耗,尤其是办公建筑采暖与空调能耗影响因素较多,并且格外的复杂,既和耗能设施有着一定的关系,同时还和建筑使用要求和方法等一系列的因素相关。建筑能耗通常指的是建筑
<正>政治学科在高考前最后一个月的复习备考中一定要注重实际、实用、实惠、实效。结合指导学生备考复习的做法,谈几点认识。一、抓住机会,把握黄金时刻最实际考前一个月是提
期刊
21世纪以来,我国金融市场发展迅猛,金融创新的速度也将加快,并且呈现出资本市场和货币市场联动的特征,本文在对我国金融市场现状研究进行总结基础上,分析了目前阻碍我国金融
笔者以柳州、昆明高新区为例,试就全球化背景下,如何推动西部高新区产业转型升级与高质量发展进行分析、论证和思考,并提出五条建议措施,即"要注重创新产业规划与发展、要注
硒是发挥着重要生物学功能的一种关键的微量元素。日粮中缺乏硒可造成鸡多种器官中发生一系列的临床和病理改变。与其它组织相比较,肾脏的硒含量较高,肾脏也是硒缺乏的靶器官
随着我国城镇化建设的不断推进,大量的公共建筑、商业楼宇、居民社区不断涌现,智能建筑的发展前景十分广阔。智能建筑项目的建设使建筑物具备了大脑与神经网络的功能,满足人
油气资源储运过程中有许多输运方式,但其中最有效及最普遍的方式依然是管道输运,在原油输运过程中原油的粘度直接影响管道输运效率。磁处理简单易实施,成本也较为低廉,对工作