基于感知加权线谱对距离的最小生成误差语音合成模型训练方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:scientist89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于感知加权线谱对(Line Spectral Pair,LSP)距离的最小生成误差(Minimum Generation Error,MGE)模型训练方法,用以改善基于隐马尔科夫模型的参数语音合成系统性能.在采用线谱对参数表征语音频谱特征时,传统MGE训练中使用的欧氏距离生成误差计算方法并不能较好地反映生成频谱与自然频谱之间的真实距离,而采用与谱参数无关的对数谱间距(Log Spectral Distortion,LSD)定义的生成误差函数可改善这一问题,但改进后主观效果不明显,且运算复杂度很高.文中先提出基于加权LSP距离的MGE模型训练方法,并在实验中从主客观对比不同加权方法以及基于LSD的MGE训练.最后,找到一种感知加权方法,不但具有较好的主观表现,而且在运算复杂度上与传统MGE训练相比几乎没有增加. This paper proposes a minimum generation error (MGE) training method based on Distance Spectral Pair (LSP) distance to improve the performance of parametric speech synthesis system based on Hidden Markov Model. Line spectral parameters for characterizing speech spectral features, the traditional Euclidean distance used in training MGE training error calculation method does not reflect the real distance between the generated spectrum and the natural frequency spectrum, and spectral parameters have nothing to do with the spectrum The generation error function defined by Log Spectral Distortion (LSD) can improve this problem, but the improved subjective effect is not obvious and the computational complexity is very high. In this paper, the MGE model training method based on weighted LSP distance is proposed first, We compare the different weighting methods from subjective and objective, as well as MGE training based on LSD.Finally, find a perceptual weighting method not only with better subjective performance, but also with almost no increase in computational complexity compared with the traditional MGE training.
其他文献
随着联合循环机组的不断增加,其对电力系统稳定性的影响也逐步得到重视,建立符合联合循环机组复杂非线性特性并易于通过参数测试获得的数学模型具有重要的现实意义.文中从模
随着我国快速机动化进程,道路交通伤害已成为我国儿童健康的严重威胁。使用机动车儿童约束装置能有效减少交通事故发生时儿童伤亡。许多发达国家通过了相关立法,儿童约束装置
病毒性角膜炎是眼科发病率很高的眼病,而且可以造成严重的视力障碍,容易反复发作,难于治疗,最终导致致盲.多由病毒感染所致,目前治疗病毒性角膜炎的疗效仍不理想,我科在2006
目的 探讨自然分娩人工饲养能否获得净化的五指山小型猪.方法 母猪自然分娩后2 h内,将仔猪处理后转到隔离器,用奶粉、米粉、饲料分别过渡人工饲养.其间分别接种7次益生菌、补
首先对海藻(A)进行温差破壁及生物酶活化处理,再接枝丙烯酸(AA)、丙烯酰胺(AM)制备可降解耐盐型保水剂。考察合成最佳条件,用复配酶对产品进行降解试验。结果表明:当冷冻-融
乙酰羟基酸合成酶(Acetohydroxyacid synthase,AHAS,EC4.1.3.18)是植物和微生物中亮氨酸、异亮氨酸和缬氨酸合成途径的一个关键酶,以AHAS为靶标的磺酰脲类除草剂具有高效、高
"请洗手",这是一条越来越普遍的建议.但值得关注的是,目前尚缺乏有关如何改善医护过程中手卫生状况的高质量研究.Cochrane图书馆2007年第2期首次发表的一篇Cochrane系统评价
目的 探讨老年期痴呆患者家属生存质量及其影响因素.方法 采用一般情况调查表、健康状况问卷(SF-36)、社会支持评定量表(SSRS)、简易智力状态检查(MMSE)、AD病理行为评分表(B
目的 了解医院体检科室体检者的健康体检原因和对健康体检服务的需求,为促进健康体检的发展提供建议.方法 2012年4月,采用定性调查方法,以体检者作为访谈对象,根据提前拟定好
TATP炸药是当前国际上出现的一种新型炸药。TATP炸药具有制作原料来源广泛,成本低,制作工艺简单,且爆炸威力大,爆炸彻底,剩余残留物少的特点,常被恐怖分子用来实施爆炸恐怖袭