一种正弦谐波模型语音转换算法的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wenzhiqiang963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换技术是语音识别、语音合成技术发展到一定阶段的综合产物,同时也是语音信号处理领域的一个重要分支。语音转换的目的是通过改变源说话人的语音特征参数,使转换参数合成语音听起来像是由目标说话人发出的,本质是特征参数的转换。这项技术几乎囊括了语音信号处理领域的各个方面,它的研究和发展对语音分析合成、语音编码、语音增强和语音识别等方面有重要的促进作用。一个语音转换系统包含两个阶段:训练和转换阶段。在训练阶段,得到参数映射规则。在转换阶段,根据映射规则,对源说话人的个性特征参数进行转换,把转换后的参数重建语音信号,得到转换语音。一般来说,一个语音转换系统的设计需要考虑以下三个方面的因素:一个有效的语音分析合成模型、一种理想的参数转换规则和代表语音个性特征的特征参数。研究表明,正弦模型是一种很好的参数语音模型,本文在对正弦语音模型研究的基础上,设计并实现了一种正弦谐波分析合成的语音转换系统,包含以下几个内容:(1)对语音分析合成模型的研究。为了得到高质量的转换合成语音,以正弦语音模型为基础,研究了基于正弦变换编码的分析合成算法,并对算法中峰值提取模块进行了改进,新的峰值提取算法增强了相邻两帧参数的相关性,提高了峰值提取的准确性,改善了合成语音的质量。(2)为了便于语音特征参数的训练和转换,在正弦模型的基础上,研究了约束简化的正弦模型,即正弦谐波模型,也能很好地重建原始语音。在正弦谐波模型中,首先估计语音的基音频率,然后用最小二乘法估计谐波幅度和相位。基音频率是语音信号韵律特性的主要组成部分,代表了激励源的特性,便于韵律特性的转换。(3)设计并实现了一种基于正弦谐波模型的语音转换系统。在训练阶段,提取源和目标语音的基音频率和倒谱参数,把倒谱参数进行联合概率密度建模,用GMM训练,EM算法求解模型参数,得到频谱参数的映射规则。在转换阶段,用均值线性法转换基音频率,根据映射规则转换倒谱参数。在转换合成时,为了改善转换语音的质量,对转换参数进行插值处理。(4)为了测试特征参数的转换效果,分别进行了男女声之间基音频率和倒谱参数的转换实验。(5)为了测试语音转换系统的转换效果和性能,分别用主观评价标准的ABX测试和客观评价标准的信噪比方式测试了转换语音。根据ABX的测试结果来看,本文设计的转换系统能实现韵律特性的完全转换,谱包络的部分转换,转换语音质量良好。
其他文献
<正>1996年Hotchkiss将严重肘关节三联损伤描述为肘关节脱位、桡骨头骨折和冠突骨折,也称为"肘关节恐怖三联征(terrible triad of the elbow)"[1]。受损的肘关节倾向于早期复
目的探讨快速康复外科理念(rapid rehabilitation surgery concept,FTS)对胸腔镜下肺癌根治术围手术期的影响。方法随机选取2015年5月~2017年5月我院收治的非小细胞肺癌患者1
文章通过工程项目实例,就预应力混凝土施工难点进行了简要地总结,针对建筑预应力混凝土施工技术要点进行了深入地论述,并提出了施工中的注意事项。
青海省电力公司近日透露,3月份,针对青海省内电力需求增速放缓、青海光伏发电发展迅猛的新形势,该公司积极开拓光伏消纳市场,利用东西部地区的错峰效益和电价差异,组织省内光伏发
报纸
随着科技的快速发展,建筑行业也进入了一个新的时期。现代智能建筑的出现恰好满足了人们日益提高的需求。在整个建筑中, 建筑电气的质量至关重要,影响着整个建筑的安全。本文
国内大多数省市(包括天津市)尚未出台具体的装配式建筑招标投标活动指导意见和管理办法,开展装配式建筑招标投标监管研究有利于天津市建设行政主管部门逐步规范天津市装配式
急速的城市化增加对城市用水量的压力,尤其是在严重缺乏本地水资源的地区,怎样在这些地区运用有效的方法管理其水资源越趋重要。水需求管理(Water demand management)是达至
会议
在梳理航运服务业定义及构成的基础上,笔者对天津航运服务业可持续发展面临的问题进行了深入分析,并结合小白楼国际航运集聚区特征以及当前和平区发展航运服务业所具有的优势
目的:初步建立人晶状体蛋白质组研究中的双向电泳分离技术,提高晶状体蛋白分辨率和重复性.方法:采用固相pH梯度(IPG)等电聚焦(IEF)为第一向、SDS-PAGE垂直电泳为第二向的双向
本文对医院临床电子病案数据库概念设计、逻辑设计和物理设计提出了一些观点,旨在提高我国医院临床电子病案的管理水平,建议采用Delphi作为前台开发工具,中介软件使用Sockect