汉语语音合成中韵律的预测方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:yuan398699360
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成是实现人机交互的关键技术之一,具有广阔的应用前景,其研究目标是合成出清晰、自然、有表现力的语音,而韵律预测则是实现这一目标的关键。本文围绕汉语语音合成中的韵律预测问题展开,重点研究了汉语韵律结构、音节时长、基频曲线的预测方法。 汉语语音中的韵律单元具有层级结构,本文针对这一特点,面向韵律结构中最为重要的韵律词边界和韵律短语边界预测问题,实现了一种分层预测方法。方法中采用了条件随机场和最大熵模型,并基于词法分析的结果对最低层单元——韵律词进行边界预测。进一步将这一层次的预测结果用于上一层次单元——韵律短语的预测。实验结果表明,这种分层预测方法可以很好地预测韵律词和韵律短语。 在文本分析和韵律结构预测工作的基础上,本文进一步开展了对音节时长的预测工作。文中针对此类预测问题的特点,改进了最大熵模型,使之能够预测出连续值。实验表明,基于这种改进最大熵模型的音节时长预测方法比传统的基于分类回归树的方法具有更好的性能。 在基频曲线的预测方法研究中,本文基于Pitch Target理论框架,结合前人研究,提出了新的基频曲线表示法,实验表明新方法对实际语音的基频曲线具有更好的拟合特性。文中分别采用了分类回归树和改进最大熵模型,基于各种语言和韵律相关特征,实现了对基频曲线参数的预测。在开集测试中,本文实现的系统所预测基频曲线的:RMSE为30.49Hz,优于广泛采用的基于分类回归树的方法。
其他文献
心音是心脏房室瓣活动的机械振动所致。心音在心血管疾病的临床诊断、尤其是对对先天性心脏病(congenital heart diseases,CHD)的初诊具有极高的诊断价值。心音图(PCG)是心脏
分类是文本处理中的一项重要的基础性工作,面向主题的文本分类可用于电子图书和期刊资源的加工,面向作者写作风格的文本分类可用于伪作鉴定、轶作确认和司法领域中文书作者的鉴
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
近年来,移动数据业务已发展成为移动业务发展的亮点,尤其是移动消息业务,占据了大部分市场份额。作为消息业务的提供商,在日益形成的网状移动业务价值链中,凸显出了重要的作用。对
鳜是我国重要的水产养殖鱼类,开展其分子免疫的研究不仅具有理论意义,而且具有重要的应用价值。本论文对鳜参与呼吸爆发的两个重要的酶—髓过氧化物酶(MPO)和NADPH氧化酶的cDNA进
随着数字战场技术的发展,对自动目标识别技术的要求也越来越高,而目标检测技术,尤其是复杂背景情况下远距离运动小目标检测技术在自动目标识别中占有很重要的地位,因为整个自
VLSI(Very Large Scale Integration)技术的飞速发展促进了控制系统的小型化或微型化,片上系统的实现已成为可能,以IP(InIellectual Property)芯核为标志的基于FPGA/CPLD的现代
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文通过对荣华二采区10
期刊
随着传感器网络、互联网、通信等技术的蓬勃发展,数据流的应用越来越广泛和深入。重症监护病房(Intensive Care Unit,ICU)是数据流的一个典型应用环境,在工CU中医护人员需要利用