基于听感量化编码的神经网络语音合成方法研究

来源 :电子科技 | 被引量 : 0次 | 上传用户:littlerabit75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前神经网络声学建模中数据混用困难的问题,文中提出了一种基于听感量化编码的神经网络语音合成方法。通过设计听感量化编码模型学习海量语音在音色、语种、情感上的不同差异表征,构建统一的多人数据混合训练的神经网络声学模型。在统一的听感量化编码声学模型内通过数据共享和迁移学习,可以显著降低合成系统搭建的数据量要求,并实现对合成语音的音色、语种、情感等属性的有效控制。提升了神经网络语音合成的质量和灵活性,一小时数据构建语音合成系统自然度可达到4.0MOS分,达到并超过普通说话人水平。
其他文献
通过在铸轧区的关键部位引入电磁-超声能场,实现对3003铝合金的普通对称铸轧、非对称铸轧和非对称电磁-超声铸轧。用该方法分别制备了上述3种铸轧带坯,并将普通对称铸轧带坯与
护士在医院工作期间面临着多种职业危害,自从1981年就有针刺伤对医务人员危害的报告[1]。针刺伤可传播20多种血源性传染病,80%~90%的健康医务人员患血源性传染病是由针刺伤所
<正> 一、我国微灌设备现状分析 近几年,我国从事微灌设备研制和生产的企业发展迅速,以北京绿源公司为代表的微灌企业,直接从国外引进技术先进、生产效率高的内镶式滴灌管生
随着我国畜牧行业的发展,饲料行业也随之快速发展。为了进一步规范饲料行业的生产经营行为,保障饲料的安全性,推动饲料产业健康有序发展,本文结合工作实践经验,对饲料安全监
金融监管体系是现代金融的重要组成部分,同时,也是一个国家金融治理水平的最直观体现。理顺监管机制、构建完善的现代金融监管体系,是发展实体经济和防范金融风险过程中重要且不
报纸
通过对韶关市市区2005~2009年的声环境现状进行分析,提出防治噪声污染的对策。
目的 观察优质护理干预联合高压氧对一氧化碳中毒迟发性脑病患者的疗效。方法 方便选取该院2014年1月-2017年12月280例一氧化碳中毒迟发性脑病患者按照是否给予优质护理干预
利用Genbank中已知SARS-Cov完整基因组信息,通过Beacon Designer 2.1软件进行其分子信标探针设计,共找出7条分子信标探针和相对应的引物,它们均分布在SARS-Cov基因组的保守区
目的:探讨诺和力联合二甲双胍治疗胰岛素抵抗2型糖尿病的临床效果。方法:将胰岛素抵抗2型糖尿病患者60例随机分为观察组和对照组,对照组给予二甲双胍治疗,观察组给予诺和力联合
具有悠久历史和文化的埃及,96%的国土面积是荒漠化土地,土壤贫瘠、干旱少雨,农业用地仅占3.7%,而人口却达6000万以上。为了在荒漠化土地上获取食物,埃及人从古至今一直与大自然拼搏。建立绿洲