汉语语音合成中自动切分技术的研究

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:a30355115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于大语料库的拼接合成由于其合成的语音清晰自然,而得到了广泛的应用。由于汉语语音合成中自动切分的精度将直接影响到语料库中基元的质量,进而直接影响到合成出的语音的质量,因此自动切分技术已经成为了汉语语音合成中的一个重要课题。在自动切分技术的研究中,作者详细地调查了自动切分的研究现状。根据研究现状,采取了目前较主流的基于隐马尔科夫模型的强制对齐的方法用于自动切分基线系统的构建中。在自动切分基线系统的构建中,作者提出了一种新的模型参数自适应方法,结果证明可以较大程度地提高自动切分的精度。作者还做了大量的实验来验证相关的语音参数在自动切分中的效果,大多数参数的挑选都被同类论文忽视,但在实际系统中却有着重要的影响。在现有的自动切分技术中,大多数研究都是基于单一模型,上下文相关或上下文无关的模型。采用单一模型内在的问题是每个边界单元只有一个模型预测的时间值,而没有考虑不同的模型对于相同声学环境下的边界的不同的作用。作者在论文中提出了以下两种方法来找到处于类似声学环境下的边界与不同模型之间的映射规则,进一步用映射规则来为每个边界找到最合适的模型。第一,利用混合模型进行汉语语音合成库的自动切分技术。所有的边界单元按照其所处的声学环境被分为十一组。在这些边界组中,将利用混合模型训练得到边界组与声韵母单音子模型(IFMM)、半音节单音子模型(SSMM)。声韵母三音子模型(IFTM)之间的映射规则。第二,使用C4.5决策树分类的算法,来训练处于相似声学环境下的边界与IFMM、SSMM和IFTM之间的映射规则,通过映射规则,为每个边界单元选取最合适的模型预测时间值。在决策树的构建过程中,问题集的选取和属性的挑选至关重要。在论文中,作者给出了自动切分中,选取问题集的方法,并给出了遗传算法和C4.5决策树默认的算法来进行属性挑选。实验结果显示,在切分精度和边界的偏移上,利用混合模型和决策树分类两种方法都取得了比单一模型进行汉语语音合成库的自动切分技术更好的结果。
其他文献
非集中建设区(以下简称"非集建区")正在成为新一轮总体规划的关注重点之一。梳理归纳得到我国对非集建区认知的三个阶段,结合我国总规创新所面临的新理念、新形势和新要求,结
目的:通过高通量测序技术研究不同单糖组成的低聚糖对人肠道菌群的调节作用。方法:以人结肠内菌群为研究对象,采用人体胃、肠道模拟系统,比较研究了分别由葡萄糖、半乳糖和甘
<正>计科系于2003年9月从数学系独立出来,1999年开始招收三年制计算机科学教育大专班学生,2003年计科系拥有计算机科学教育与计算机应用技术两个专业,2006年保山市政府与云南
近年来,无公害蔬菜种植随着需要增加逐步扩大种植规模。对无公害蔬菜种植及管理技术也被越来越多的业内工作人员重视。无公害蔬菜在菜品质量上,食用安全上及营养价值上深受消
水稻在我国有悠久的栽培史,是农业经济中重要的粮食作物,也是我国居民餐桌上的主要食物。随着我国经济的快速发展,农业科技水平的不断提高,对水稻的栽培技术及水稻的产量和质
由于数学的严谨性,许多小学生对数学的学习都存在抗拒的心理,对数学学习始终提不起精神,导致数学课堂教学一直处于低效。究其原因:其一,教师的教学模式过于陈旧,没有尊重学生的学习
一、现阶段农村散猪养殖过程中疫病防治现状的基本概述。畜牧养殖作为基层产业的重要组成部分,近年来随着全面建设小康社会战略目标的实践,畜牧养殖规模和养殖数量在持续增加
<正> 1.协助企业领导贯彻上级有关安全生产指示,及时转发上级和有关部门的安全生产文件、资料。做好公司安全会议记录,对安全部门的有关材料,及时组织汇审打印、下发。 2.组