语音合成系统中关键技术的研究

被引量 : 0次 | 上传用户:hulala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合成语音自然度的提升是当前语音合成系统关注的首要问题,而韵律结构预测和语调生成是其中的关键技术。本文针对参数化语音合成系统中韵律结构预测和韵律声学参数生成、语调控制等进行了研究,建立了基调归一化的语调表示方法,提出了语调控制模型。论文的主要工作如下:1.论文提出了一种基于决策树的韵律结构预测算法。首先收集了汉语大规模文本语料,对其进行了人工韵律标注,并分析归纳了语法、语义对韵律结构生成的约束。选取了语法和语音相关的特征集,设计了相应的问题集,实现了基于决策树的韵律结构预测算法。试验证明,本韵律结构预测算法可以取得较好的预测正确率。2.提出了一种基于基调与降阶指数的参数化语调表示方法。论文统计分析了大规模陈述语句音高和音高变化的表现,定义了描述陈述语调的特征参数基调与降阶指数,提出了基于基调与降阶指数的参数化语调表示方法,在语料库中训练了语调特征参数。针对语句中的任意声调组合,计算了基调归一化参数,实现了对语料库中含有任意声调音节的句子语调的分析和处理。3.提出了一种参数化语音合成系统中合成语音的语调控制方法。采用本文所提出的参数化语调表示方法在合成语料库上训练了基础语调特征参数。根据基调与降阶指数的需求,计算新的特征参数,更新HMM合成系统中待合成语音的声学参数,合成了富于变化的陈述语调。提出了一种疑问语调调型的差异模型,使用MSDHMM训练疑问句与陈述句语调差异,并对差异的MSDHMM参数进行聚类,得到了生成疑问句语调的差异参数。将疑问语调调型的差异模型应用于HMM合成系统中,实现了疑问句语调生成。4.基于发声生理模型,利用分析–合成的方法分析了生理发声参数对声学特征影响。抽取了愤怒情感中冷怒(cold anger)与暴怒(hot anger)的声学特征,分析表明这两种情感语音的频谱高频部分的变化不同。基于生理发声模型,分别修改声管和声源参数,模拟生成的上述两种情感语音表明,声管与声源参数引起语音频谱的不同改变。5.构建了具有语调可控的参数化合成系统,基于论文提出的语调控制模型与参数化语调表示方法,实现了对合成语调的控制,并可以实现疑问语调的生成。
其他文献
企业文化的建构不是无源之水,无本之木,中国五千年的传统文化博大精深,并始终在影响着中国商业的发展。现代企业制度传入中国之后,它必然要与传统文化有机的融合到一起,才能在中国
最近20年,随着全球经济的发展,各国的企业也越来越处在同一个竞争平台,为了保证企业在市场竞争中不被淘汰,必须加强基于供应链的管理制度的建设。企业之间的竞争也从原来的资金粗
世界各国教师教育变革经历了复杂的过程,期间形成和流行过各种理念,这些理念源于教师研究的不同热点,及这些研究所凭借的理论背景。本文重点讨论教师教育变革的三大理念"教师
部门集中采购质量是指通过部门集中采购活动,实现采购目标,满足各方特别是采购使用方的要求的程度。文章对教育装备部门集中采购质量控制策略进行了探索。
<正>1病历资料患者男,43岁,2005年5月因突发右眼视力下降就诊。询问病史发现患者有反复口腔溃疡病史12年,有假性毛囊炎及阳性针刺反应,诊断为白塞病色素膜炎,予大剂量激素及
我国公立医院属于非营利性质的事业单位,受传统管理体制的影响,自主性与应有的活力显得不足。在人力资源管理方面存在比较多的问题,严重影响了医护人员综合素质的提高,削弱了
基于高瓦斯低位放顶煤工作面瓦斯涌出量大、回采期间瓦斯容易超限的问题,提出采用单元法测定和分析工作面瓦斯涌出及分布规律。以五阳煤矿7607综放面为研究对象,将工作面划分
房地产业作为中国经济发展的重要支柱性产业,其发展关乎国计民生,研究房地产未来发展趋势非常重要,而预期是肯定与房地产泡沫相关联的,因此对房地产泡沫的度量研究也就显得极为重
近些年大量资金涌入农业产业,大型现代化温室以其高效的土地利用率及标准化的生产模式而开始受到业内的青睐。国内兴起了新的一波现代智能温室热潮。好马还需配好鞍,大型现代
美国大学教育学院的教师教育改革措施包括,廓清对教学本质的认识以及教学的知识基础,达成对教师教育的共同认识;通过采取课程学习与实习同时进行、把教师培养重心从象牙塔转