改进的跨语种语音合成模型自适应方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户：guiminzhu18

【摘要】

：

统计参数语音合成中的跨语种模型自适应主要应用于目标说话人语种与源模型语种不同时,使用目标发音人少量语音数据快速构建具有其音色特征的源模型语种合成系统.本文对传统的

【作者】

：

刘航凌震华郭武戴礼荣

【机构】

：

中国科学技术大学电子工程与信息科学系讯飞语音实验室,

【出处】

：

模式识别与人工智能

【发表日期】

：

2011年04期

【关键词】

：

隐马尔科夫模型(HMM) 语音合成跨语种模型自适应音素映射

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

统计参数语音合成中的跨语种模型自适应主要应用于目标说话人语种与源模型语种不同时,使用目标发音人少量语音数据快速构建具有其音色特征的源模型语种合成系统.本文对传统的基于音素映射和三音素模型的跨语种自适应方法进行改进,一方面通过结合数据挑选的音素映射方法以提高音素映射的可靠性,另一方面引入跨语种的韵律信息映射以弥补原有方法中三音素模型在韵律表征上的不足.在中英文跨语种模型自适应系统上的实验结果表明,改进后系统合成语音的自然度与相似度相对传统方法都有了明显提升. The cross-language model adaptation in the statistical synthesis of speech parameters is mainly used when the target speaker’s language is different from that of the source model, and a small amount of speech data of the target speaker is used to quickly build a language model synthesis system of the source model with its timbre characteristics. Phoneme mapping and triphone model to improve the cross-language adaptive method, on the one hand through the combination of data-based phoneme mapping method to improve the reliability of phoneme mapping, on the other hand the introduction of prosodic information mapping across languages to make up for the original method of three Phonetic model is lack of rhythm characterization.Experimental results on the Chinese-English cross-language model adaptive system show that the naturalness and similarity of the system synthesized speech are improved obviously compared with the traditional methods.

其他文献

氧化铁薄膜的水热合成及其光电转换性能

通过水热方法在掺杂氟的SnO2(FTO)导电玻璃上制备了不同形貌的氧化铁薄膜.利用无机铁盐浸渍法在FrO玻璃上进行氧化铁晶种的预处理使得所制备的氧化铁薄膜更致密且均一.研究了

期刊

氧化铁水热薄膜光电化学iron oxidehydrothermalthin filmsphotoelectrochemical propertie

构建流域农业非点源污染控制的环境经济手段研究--以福建省九龙江流域为例

阐述了环境经济手段在我国农业非点源污染控制中应用的必要性和可行性.并结合福建省九龙江流域农业非点源污染的主要问题,提出"畜禽养殖税(费)、排污权交易,化肥和农药施用税

期刊

环境经济政策非点源污染污染控制农业

封丘地区土壤水分扩散率的研究

本文研究了河南封丘地区代表性土壤的水分扩散率,结果表明:封丘地区3个土壤亚类的水分扩散率变化于1. 0×10-3 ~1. 5×10cm2 min-1之间;土壤水分扩散率存在着空间上的变异性,随土壤剖面深度增加而呈现出表土层高、中间土层低、底土层又升高的趋势;各土层土壤水分扩散率与土壤含水量呈指数函数变化关系,经统计分析均达到极显著水平;土壤容重、孔隙度及孔隙类型、土壤有机质含量和土壤粘粒含量均对土

期刊

封丘地区土壤水分扩散率影响因素

亚慢性毒性研究中基剂量法的应用

目的应用基准剂量法评价特丁净亚慢性毒性阀值,并与NOAEL法(未见有害作用量,no observedadverse effect level)进行比较.

期刊

基准剂量NOAEL亚慢性毒性特丁净

机载MIMO雷达两级降维杂波抑制方法

该文针对机载MIMO雷达杂波抑制问题,提出一种低复杂度的空时自适应处理(STAP)方法.首先利用多普勒滤波对杂波信号进行时域降维处理;然后将空域发射-接收2维波束形成权向量表

期刊

机载雷达MIMO雷达空时自适应处理(STAP)杂波抑制降维

烧伤血清对骨髓红系及粒系造血功能影响的实验研究

目的观察烧伤血清对正常小鼠骨髓红系、粒系造血功能的影响,初步探讨其可能的机制. 方法常规制备小鼠骨髓细胞(BMC),用其分别建立红系集落形成单位(CFU-E)培养体系和粒-单核

期刊

骨髓细胞红系祖细胞粒-单系祖细胞烧伤血清造血调控

二维铜配合物{[Cu2(BIPA)2(bpe)2] H2O}n的合成、晶体结构及磁性

本文以5-溴间苯二甲酸(H2BIPA)、1,2-双(4-吡啶基)乙烷(bpe)和Cu(NO3)2·3H2O水热反应得到了一个配位聚合物{[Cu2(BIPA)2(bpe)2]·H2O}n.并用元素分析、红外光谱以及X-射线单

期刊

铜配合物5-溴间苯二甲酸晶体结构磁性Cu(Ⅱ) complex5-bromoisophthalic acidcrystal structurema

提高多址接入性能的功率与LDPC码的优化设计

为了逼近多址接入信道的容量限,对功率与低密度校验阵(LDPC)码的度分布进行了优化.基于互信息最大化准则设计了功率分配算法,并得出分配方案,利用高斯近似来近似取得因子图上

期刊

多址接入信道低密度校验阵码高斯近似交织多址功率分配码优化

水稻籽粒酚反应基因的QTL分析和定位

以籼粳交组合(Balilla/Nanjing 11)的DH群体及其构建的遗传图谱为基础, 对籽粒酚反应基因进行初步QTL定位, 共检测到2个加性效应和2对上位性效应的QTLs, 其中qPH4-3的贡献率

期刊

水稻苯酚反应QTL分析定位

基于综合建模的3类电池储能电站性能对比分析

新型蓄电池的诸多特点使其十分适用于平抑变化频繁且剧烈的功率波动,例如可再生能源的输出功率。如今较有前景的新型电池储能技术有锂电池、钠硫电池和液流电池。为比较研究

期刊

电池储能电站锂电池钠硫电池液流电池可再生能源动态规划battery energy storage system（BESS）lithium batt

改进的跨语种语音合成模型自适应方法

其他学术论文