基于独立说话人模型的语音转换

来源 :苏州大学 | 被引量 : 0次 | 上传用户:myxzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指将源说话人的语音经过转换,使之听起来像是目标说话人的语音。语音主要包括语义信息和说话人的个性化信息,语音转换是通过改变与源说话人个性特征有关的声学特征参数,而保留语义信息不变,使得转换后的语音的个性特征与目标说话人更接近。传统的语音转换往往采用平行语料训练源-目标说话人联合语音模型并由此推导相应的语音转换规则,但实际应用中不仅难以得到完全平行的语料,而且训练联合语音模型需要消耗大量的计算、系统扩展不方便。本课题研究一种基于完全独立的说话人语音模型进行语音转换的方法,主要内容包括:1.研究STRAIGHT分析与合成算法,基于STRAIGHT平台调整与说话人个性特征有关的参数。2.采用平行语料,以GMM为联合语音模型建立语音转换基准系统,分析高斯混合模型(GMM)的特点。3.提出结构化高斯混合模型(SGMM: Structured Gaussian Mixture Model)描述说话人的声学特征空间。4.研究怎样使用全局声学结构(AUS: Acoustical Universal Structure)对齐不同SGMM中的高斯分布。5.给出基于独立说话人模型的语音转换系统总体框架,并编程实现整个系统。ABX和MOS实验表明论文提出的语音转换方法可以得到与传统的平行语料联合训练方法接近的转换性能,并且转换语音的目标说话人识别正确率达到94.5%。实验结果充分说明了本课题提出的方法不仅具有较好的转换性能,而且具有较小的训练量和很好的系统扩展性。
其他文献
固有的频谱分配方式降低了频谱利用率,越来越多的无线业务的出现也加剧了频谱资源紧缺的现象。而认知无线电(CognitiveRadio,CR)的诞生解决了这些问题。随着认知无线电研究的迅速
近年来贝叶斯方法在图像和信号处理方面获得了广泛的应用,统计信号和图像处理中一个日益重要的话题就是非高斯信号特征和数据的建模。有限混合模型提供了个强大、灵活以及原
在非合作条件下,尤其是通信对抗领域,需要对接收到的数据的编码类型及参数进行分析以便得到信息及时作出反应,而信道编码识别技术就是在未知或已知部分先验知识的前提下,从接收数
近几年,P2P技术发展迅猛,对人们的生活产生了极大的影响。在对等网络中,如何高效的定位查询资源是P2P应用的关键所在,因此,P2P资源搜索算法越来越成为研究的热点。本文首先介
近年来,立体电视(3DTV)和自由视点电视(FTV)等3D应用成为人们娱乐生活追求的热点。3D重建、虚拟现实等技术在工业工程设计,城市规划,数字博物馆等相关领域也具有广阔的应用前
在现实生活中,经常会遇到未知源信号及其混合信道的情况,人们能够得到的有效信息仅仅是源信号经混合以后得到的观测信号,在这种可利用信息极少的情况下,如何将源信号分离出来就成
近些年来,人们对石油等能源特别是石油的需求越来越大。而根据专家的估计,已经探明的石油资源在未来的三十到五十年内将面临枯竭。因而,找油找气是石油勘探领域十分重要的目
拖曳线列阵声纳是水面舰船和潜艇重要的声纳装备之一,具有基阵尺寸大、工作频率低、能隐蔽地发现远距离目标的特点。但拖曳线列阵在实际应用中受到流速航速等的影响,易产生阵元位置误差,使阵处理性能下降。且由于拖缆长度有限,浅海环境下拖船辐射噪声对声纳性能的影响较为严重。另外观测扇面内常出现较强随机干扰,对目标的探测造成影响。本论文针对以上问题,研究拖曳线列阵阵形校正技术、拖船干扰抑制技术以及随机强干扰抑制技
学位
认知无线电技术是无线电技术发展的一个里程碑,它是目前解决频谱资源稀缺的关键技术。认知无线电技术允许非授权用户通过频谱检测并动态地调整发送功率、频谱和调制方式等参
随着无线通信技术在军用和民用领域的快速发展,人们对无线系统小型化的要求越来越迫切。近年来,众多的研究机构和科研工作者都对这一热门课题进行了深入探索。本文以两个小型