特定说话人的声音变换

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户：b278651776

【摘要】

：

特定说话人的声音变换就是将一个特定说话人的声音变换成另外一个特定说话人的声音。本文旨在实现和改进一个完整的特定说话人的汉语语音转换系统，在总结以往该项技术的基础上

【作者】

：

刘昆

【机构】

：

中国科学院声学研究所

【出处】

：

中国科学院声学研究所

【发表日期】

：

2007年期

【关键词】

：

特定说话人声音变换汉语音素稳定帧语音转换系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

特定说话人的声音变换就是将一个特定说话人的声音变换成另外一个特定说话人的声音。本文旨在实现和改进一个完整的特定说话人的汉语语音转换系统，在总结以往该项技术的基础上，针对语音协同发音的一些现象，提出选取每个音素稳定帧上的特征来代替整个音素的特征的方法；提出了一个新的基于汉语音素的声音变换系统；另外，提出了一个以非并行语料为训练数据的非并行声音变换系统：同时，还将基于音素的声音变换技术扩展到英文声音变换系统中去；最后，还完成了一个准实时的声音变换演示系统。本文主要工作和贡献有以下几个方面：　　 1、提出一种新的参数选择方法，即为每个元音音素选取稳定帧，选择稳定帧上的参数代替该元音音素的参数。该方法能够通过选取该音素中间的稳定段参数作为对应音素的参数的手段，避免以往方法中不考虑协同发音对声学特征的影响，而将音素过渡段的参数进行模型训练的问题。　　 2、本文还分析了口音对汉语元音音素共振峰频率的影响，研究表明：口音对于单元音[O，I，U]的第二共振峰频率F2的影响较大；口音对单元音[A]的三个共振峰频率没有显著影响。　　 3、主要元音的选择。为了减轻基于音素的声音变换系统合成的声音频谱出现的很多不连续的现象，我们提出为每个韵母选取一个主要元音音素来代替对应的整个韵母部分，这样可以将语音频谱按音节分割成一些较长的频谱段，减少变换后频谱的不连续现象。　　 4、提出了新的基于汉语音素的声音变换系统。根据观测传统分类得到的参数可以看到，这样训练得到的模型很难很好的表征不同音素的参数特点，因此，为了将每个音素的特征分别进行表征，提出为每个音素训练一个GMM的方法来实现声音变换系统。该系统的MOS分和ABX分分别比基线系统提高了47％和26％。　　 5、实现一个以非并行语料为训练数据的非并行声音变换系统。由于在实际应用中很多情况下通常不能满足并行数据的条件，针对这种应用需求，本文提出一种采用非并行语料进行训练的声音变换系统，与基于音素的并行系统相比，两个系统性能相当。　　 6、将基于音素的声音变换技术推广到英文声音变换系统中。目前声音变换技术除了在汉语普通话上进行研究以外，还有很大一部分研究工作是在英语上的。因此，为了能够和国内外的英文声音变换系统相比较，本文将前面所介绍的基于音素的声音变换技术应用到英语中，实现了一个英文的声音变换系统。　　 7、完成了一个实时的声音变换演示系统。本文实现了一个基于单音素[A]进行汉语语音音色变换的实时演示系统。

其他文献

无线网络摄像机的设计与实现

随着网络和多媒体技术的广泛应用，集成化、数字化和网络化的网络数字监控系统已逐步开始取代传统的视频监控装置。与传统的视频监控系统相比，网络数字监控系统有许多优势，如数字

学位

网络数字摄像机嵌入式处理器数字图像网络数字监控系统

视频会议控制管理系统的设计与实现

基于IP网络的视频会议系统可以实现在网络上实时地传输视音频信息以及共享数据，使与会者之间可以不受空间限制进行直观、真实的面对面的交流。视频会议系统在远程医疗、远程教

学位

视频会议控制视频会议控制资源管理资源管理实时信息实时信息用户管理用户管理IP网络IP网络

人工耳蜗装置言语信号处理方法与实现

人工耳蜗是帮助全聋人恢复听力的一种医疗仪器，其基本原理是用微弱电流脉冲直接刺激聋人耳蜗内的听神经，使聋人恢复听觉。　　言语信号处理方案一直是人工耳蜗中的关键技术。

学位

人工耳蜗言语信号处理DSPSPEAK谱峰可编程性帧编码

遥感图像无缝自动镶嵌的算法研究与实现

传统的影像镶嵌技术经常由于两幅影像的几何差异和辐射差异，使得镶嵌结果出现模糊和假边界.在实际的镶嵌过程中，由于各种累计误差使得纠正过的正射影像在拼接时也存在困难：由于

学位

遥感图像影像镶嵌图像匹配算法

水稻长护颖突变体基因图位克隆

水稻长护颖突变体Long glume(lg)是从育种中间材料中发现的一个花器官自然突变体,突变体的护颖长于果实总长,花器官的其余部分均正常。遗传分析表明,该突变体性状受一对隐型单基因控制。双子叶植物花器官发育的ABC 模型已基本成熟,以水稻为代表的单子叶植物花器官发育模式目前尚无定论,护颖是对应于单子叶的花萼或花瓣?或两者都不对应?目前都是猜测。研究水稻长护颖突变体对完善和补充单子叶植物花器官发育

学位

长护颖图位克隆STS 标记CAPS 标记

基于卫星传感器参数的RFM模型解法研究及应用

传感器的成像几何模型的建立是进行摄影测量立体定位处理的基础，它反映了地面点三维空间坐标与相应像点的像平面坐标系中二维坐标空间的数学关系，一般分为两类：基于共线方程法的

学位

商业卫星卫星传感器参数有理函数模型几何纠正病态方程遗传算法

基于时变的日志挖掘和协同过滤算法的图书推荐系统的设计与实现

时至今日，数字图书馆已经走过了一段相当长的发展历程。随着馆藏资源由“信息匮乏”转为“信息过载”，数字图书馆建设也从初期的基础建设、资源积累、技术开发，朝着更深、更广层

学位

个性化服务内容挖掘日志挖掘协同过滤算法图书推荐系统数字图书馆

不同固沙模式土壤水分动态变化及预测研究

土地沙化已经成为我国最严重的生态环境问题之一,而不断加剧的沙尘暴又使生态环境问题雪上加霜。流动沙丘作为沙尘暴的主要源头之一,其风蚀移动造成大面积农田掩埋、沙埋村庄

学位

不同固沙模式土壤水分动态变化模型预测

苹果基因组中F-box基因家族的鉴定及分析

F-box蛋白家族的特征是包含至少一个由40-50个保守氨基酸组成的F-box结构域。F-box蛋白是植物泛素酶体的重要组成部分,通过泛素化途径参与到多种细胞通路,比如花器官发育、信

学位

F-box基因家族苹果基因组分析表达模式生物信息

基于综合信息模型的太阳活动预测方法

空间环境是航天技术和无线通讯技术要考虑的重要因素之一。扰动空间环境的驱使源是太阳活动，研究并掌握太阳活动变化规律并对其进行准确预报具有重要的理论意义和广泛的应用前

学位

太阳活动周期统计先验类方法综合信息模型峰值预测

特定说话人的声音变换

与本文相关的学术论文