统计参数语音合成中的基频建模与生成方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：llhxdlb

【摘要】

：

基于隐马尔科夫模型(Hidden Markov Model, HMM)的统计参数语音合成是当今主流的语音合成方法之一。该方法在训练阶段利用录制的语音数据库,建立描述不同上下文环境下频谱、

【作者】

：

高丽

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2015年期

【关键词】

：

语音合成基频建模基频生成情感语音合成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于隐马尔科夫模型(Hidden Markov Model, HMM)的统计参数语音合成是当今主流的语音合成方法之一。该方法在训练阶段利用录制的语音数据库,建立描述不同上下文环境下频谱、基频等声学特征分布的统计声学模型；在合成阶段,该方法依据输入文本的上下文信息,从训练的统计声学模型中生成声学特征,最终通过参数合成器重构语音波形。相对单元挑选与波形拼接合成方法,基于HMM的参数合成方法具有系统构建自动化程度高、合成语音平滑流畅、系统尺寸小等优势,但是其合成语音的自然度仍有待提高。基频描述了浊音产生过程中声带震动的频率,是一种重要的语音声学特征。在基于HMM的参数语音合成中,基频特征的预测性能对于合成语音的自然度有着直接的影响。此外,基频特征的差异对于体现情感语音合成中的不同目标情感也起到重要作用。相对频谱特征,基频特征是一种超音段特征,长时的基频轨迹形状受到语调、短语边界、轻重读等韵律属性的影响。而传统基于HMM的参数语音合成使用和频谱类似的基频特征提取尺度和建模方法,忽略了基频的长时特性,影响了合成语音的自然度。本文围绕统计参数语音合成中的基频建模与生成方法开展研究工作,使用长度规整基频矢量(FO Vector, FV)、目标逼近(Target Approximation, TA)特征等音节层表征作为基频特征,实现了基于目标逼近特征的基频建模,提出了基于音节层特征的生成基频后处理方法,提高了合成语音的自然度。此外,本文还进一步将基于目标逼近特征和高斯双向联想贮存器(Gaussian Bidirectional Associative Memories, GBAM)的后处理方法应用于合成语音的情感转换,对于高兴和生气情感,取得了优于传统的模型自适应方法的转换后语音情感表现力。本文的具体内容组织如下：第一章是绪论,将简要回顾语音合成技术的发展史,并介绍现阶段语音合成的主流方法、情感语音合成、以及基频的相关背景知识。在第二章将介绍基于HMM的参数语音合成方法,包括方法概述、训练端与合成端的核心算法、存在问题分析等,最后阐述了本文研究内容的动机与出发点。第三章具体介绍基于目标逼近特征的基频建模方法。该方法在训练阶段利用目标逼近模型对音节层的基频轨迹进行参数化处理,然后构建聚类决策树来描述不同上下文环境下的目标逼近特征分布；在合成阶段,该方法从预测的目标逼近参数中恢复音节基频轨迹,并结合传统方法生成的频谱特征恢复语音波形。实验结果表明了该方法可以生成较为自然的合成语音,也指出了其存在对于基频轨迹细节丢失的问题。第四章具体介绍基于音节层特征的生成基频后处理方法。该方法在训练阶段首先提取传统HMM合成方法预测基频以及录音语料中的自然基频所对应的音节层基频特征,包括基频矢量特征和目标逼近特征等,然后构建从预测基频音节层特征向自然基频音节层的特征映射的后处理模型,包括全局方差均衡化、GBAM.残差补偿模型等；在合成阶段,该方法对传统HMM方法预测的基频轨迹进行后处理,以得到最终的基频生成结果。主观实验结果表明该方法可以有效提高合成语音的自然度。第五章具体介绍基于目标逼近特征的合成语音情感转换方法。该方法针对在目标情感数据量有限情况下的情感语音合成系统构建问题,通过建立中立合成语音的音节层目标逼近特征向目标情感语音相应特征的映射关系,实现中立合成语音基频特征向目标情感的转换。本章使用GBAM模型进行不同情感间目标逼近特征的转换。实验结果表明,该方法对于高兴、生气等高唤醒度情感可以取得比最大似然线性回归(Maximum Likelihood Linear Regression, MLLR)模型自适应方法更好的合成语音情感表现力。第六章对全文进行了总结归纳。

其他文献

棉纺织发展呼唤装备

棉纺织行业是纺织工业的主要行业,棉纺织行业的年加工纤维量约占纺织工业加工纤维总量的60%左右.棉纺织行业又是纺织工业的基础性行业,棉纱布的质量、品种直接影响印染、针织

期刊

棉纺织行业纺织工业后加工产品自主知识产权棉纺织技术装备状况质量直接影响纤维生产效率品种经济效益棉纱布总量针织印染企业技改基础

基于SyncML协议的数据同步技术的研究

在当今的信息社会中,我们的日常工作、生活中需要传递各种数据信息。然而不同通信设备完成数据信息的交互时,要求我们存储于不同设备中的同一信息要时刻保持更新,比如随身携

学位

数据同步SyncML同步标签大对象

宽带无线接入系统的下行关键技术研究

随着通信技术的不断发展，第三代移动通信系统已日益成熟，人们开始将更多的研究热点转向了下一代移动通信系统。在下一代移动通信系统的发展过程中，出现了两条演进路线，一条是由IE

学位

宽带无线接入下行关键技术

稳出口,要破新壁垒

当前技术性贸易壁垒的五个特点:内容更广泛、结构更有系统性、有合法的外衣、方式更隐蔽和灵活、实施的不公平性.这些特性都标志着技术性贸易壁垒就是一道披了合法外农的“绿

期刊

出口技术性贸易壁垒不公平性系统性外衣特点屏障内容绿色结构

卫星导航系统基于FFT的扩频码快速捕获算法研究及DSP实现

扩展频谱通信系统是指待传输信息的频谱用某个特定的扩频函数扩展后成为宽频带通信号，送入信道中传输，在利用相应手段将其压缩，从而获取传输信息的通信系统。本文研究的卫星导航

学位

卫星导航系统FFT原理扩频码快速捕获算法DSP芯片接收机

802.16多媒体QoS保证机制的研究与仿真

宽带化是通信网发展的必然趋势。宽带无线接入(BWA，Broadband Wireless Access)系统是解决“最后一公里”问题，即从客户网到核心网之间的接入瓶颈的有效途径。在不久的将来，宽带

学位

多媒体服务质量调度算法接入控制

浙江轻工业如何再拾升势?

2008年全省轻工产品完成产品销售收人8941.29亿元,比上年同期增长11.12%.基本保持产销平衡,轻工全行业产销率为97.01%.同纺织业一样,轻工业也是浙江的传统优势产业.改革开放3

期刊

浙江轻工业行业发展轻工产品快速发国际金融危机运行态势优势产业宏观经济改革开放产销平衡产品销售产品生产纺织业产销率四季市场面积

化纤何处去

2008年我国化纤工业的总产能达到2790万吨,产量2405万吨,均超过世界的一半份额.在经济全球化的时代,中国化纤工业已成为国际上的竞争主体.化纤的年使用量占纺织纤维加工总量

期刊

化纤工业行业结构调整纤维加工总量经济全球化竞争主体纺织涤纶总产能使用量中国时代产量

基于嵌入式Linux的AIS接收机的设计

随着AIS在船上的普遍装载，AIS的技术发展及其广阔应用前景越来越受到人们的重视。设置AIS的目的是为了自动船舶识别、协助目标跟踪、减少话音报告、简化信息交换并提供附加信

学位

船舶自动识别系统(AIS)VTSARMGMsK

攻克REACH难关再敲欧盟大门

欧盟REACH法规是中国出口产品面临最大、最复杂、影响面最广的技术贸易壁垒.因为欧盟REACH法规,浙江经济所受的影响至少是数十亿欧元.rn中国与欧盟1400亿欧元的贸易全部都要

期刊

REACH欧盟技术贸易壁垒法规中国浙江经济欧元大宗产品出口产品影响面自然伤害

统计参数语音合成中的基频建模与生成方法研究

与本文相关的学术论文