连续语流中焦点重音的分析与生成

来源 :清华大学 | 被引量 : 0次 | 上传用户:milan_27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
焦点重音是言语工程和语音学关注的热点问题。焦点生成技术可以提高生成语音的自然度、表现力,在人机语音交互领域具有广泛的应用前景。论文分析了焦点语音中焦点的声学特征变化规律,研究了焦点语音的建模、转换与合成方法。论文的主要成果及创新点如下:1、提出了一种基于局部凸显度的焦点重音的量化和建模方法。论文首先定义了音节局部凸显度特征,该特征较好地反映了音节声学特征在局部辖域的凸显程度。然后基于焦点的声学特征局部凸显度,融合韵律结构位置和相对焦点位置等特征,建立了英语中性到焦点语音的声学特征变化的量化模型,为焦点语音的转换与生成,奠定了数学基础。2、提出了一种基于HMM的焦点语音合成框架。在有限训练语料的条件下,该框架采用焦点无关问题、焦点相关问题的二级决策树保证合成语音自然度,采用基于代价计算的HMM选取算法和参数补偿算法提高合成语音的焦点强度。基于该框架,分别提出了基于统计参数的和基于决策树上下文参数的英语焦点语音合成模型。实验表明,该模型合成语音的自然度和焦点强度高于已有模型。3、提出了一种基于凸显度的英语中性到焦点语音转换模型,采用线性变换矩阵描述中性语音声学特征局部凸显度与中性到焦点语音声学特征变化的相关性以及声学特征之间的相关性。提出了一种基于转换模型指导的焦点语音合成模型,采用离散化方法提取中性语音声学特征相关标注,并设计了用于决策树训练的声学特征相关问题,建立了预测参数可控的HMM模型。在合成阶段,采用转换模型预测焦点语音的声学特征,进而指导HMM模型合成焦点语音。由于HMM模型是由中性语料训练得到的,降低了模型训练对焦点语料的需求。4、提出了一种的汉语语句重音声学参数的非线性生成算法。统计了大规模语句的语调特点,基频主要呈下降趋势。分析了语调调型无关的重音声学特征凸显度表现,提出了由重音声学特征凸显度和韵律短语辖域内其他音节声学特征到重音声学参数的非线性映射算法,建立了支持重音生成的汉语语音合成系统,实验表明,基于该算法建立的语音合成系统可以有效合成带有重音的语音,提高了合成语音的自然度和表现力。
其他文献
量子保密通信是量子信息科学对现代保密通信提出的一种新的解决方案,因其在理论上能够达到无条件安全而极具发展前景和战略意义,在最近的二十年间获得迅速发展。受当前技术水
目的研究早期神经康复治疗卒中后抑郁的临床治疗效果。方法选择2014年5月至2016年7月我院收治的70例卒中后抑郁患者作为研究对象,根据随机数字法将70例患者分成对照组与观察组
为了积极贯彻落实《国务院关于批转财政部权责发生制政府综合财务报告制度改革方案的通知》(国发[2014]63号)的要求,构建统一、科学、规范的政府会计核算标准体系,财政部根据
恶性胸/腹水绝大多数由恶性肿瘤胸/腹膜转移所致,少数由胸/腹膜间皮瘤引起。近年来随着恶性肿瘤发病率不断上升,恶性胸/腹水患者也不断增多。对恶性胸/腹水做出及时而准确的诊断,对于
"五步导学"是老师指导学生学习科学的载体,通过小组展示,以问拓思,有利于获得更有价值的信息。"五步导学"从"问题引领"到"问题解决"为教学主线,培养小组合作能力,提高教学效益。