基于谱包络和超音段韵律的语音转换技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:wangzhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指改变源说话人的语音个性特征,使之具备目标说话人的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种处理技术。语音转换的研究是在语音识别和语音合成的研究基础上进行的,同时也是这两个领域的丰富和延拓,具有巨大的应用前景和理论研究价值。论文的主要工作包括以下几个方面:1.针对传统高斯混合模型中,高斯混合数过大会引起合成语音过平滑的问题,提出利用部分转换分量函数的加权和代替传统GMM模型的全转换函数,改善了过平滑现象。为进一步避免过平滑,利用弯折函数直接对LSF参数进行转换,并利用改进GMM模型的转换结果对语音谱进行调整,使语音谱包络的转换更加精确。2.在传统的基音周期检测方法的基础上,提出了一种新的基于RWAF变换的基音周期检测方法,并通过对候选值进行加权确定最终的基音周期,提高了基音周期检测的准确性。3.针对传统的基音周期转换仅对短时基频作固定均值转换的问题,提出从基频轨迹提取出基元段特征参数矢量,并利用基于GMM的独立建模方法对基元段参数空间进行训练,得到比固定转换规则更具优势的实时动态转换规则,使基音周期转换效果更好。F0 t4.将上述方法运用于语音转换系统进行仿真测试,从主观和客观两个方面对转换后的语音进行评价。实验结果表明,该系统在保证转换语音目标倾向性的同时,提高了语音质量,得到了较好的转换效果。
其他文献
随着传感器技术、无线通信技术和嵌入式计算机技术的迅速发展,无线传感器网络已经逐步成为当前无线网络界关注的新兴前沿科技研究热点之一,在众多领域具有十分广阔的应用前景
现阶段由于大量的袭击警察的社会事件的频发,已经引发人们开始思考警察在执法过程中是否已经成为执法的“弱势群体”.由于警察的性质、职能和权限等原因警察本不是“弱势群体
赤水河是长江上游右岸的一条重要支流,位于云贵川三省交界地带,发源于云南省的镇雄县,最终流经四川省汇入长江.赤水河地势南高北低,干流全长436km,其中遵义仁怀市境内长119km
红外硫系玻璃光纤可透中红外及远红外波段,且具有诸多优良特性如:化学稳定性好、折射率范围可调等,可用于传输红外激光,在军事、医疗等领域具有广泛的应用前景。  本文首先采用
我国不少中小型油库处在人烟稀少的环境下,由于油库的内部工作环境具有高危险性,并且油库管理的信息化水平不高,所以实现安全高效的远程管理具有重要意义。本课题所讨论的油
随着大数据时代的来临和“互联网+”技术的蓬勃发展,文本、静态图像、音视频等数字多媒体文件已经成为信息的重要载体,广泛应用于新闻、娱乐等各个领域,同时也带来了许多信息安
随着数据采集技术和嵌入式系统的飞速发展,以及现代工业测控领域,人们对数据采集的要求越来越高,本文提出了将这两种技术结合来实现微型化、大容量、高实时性、高稳定性和友
多媒体服务中,音视频同步是影响用户感知体验的一个核心问题,其同步的好坏直接关系到在线视频点播、远程视频教学等多媒体服务质量的高低。以信息隐藏思想为基础的基于 H.26X的
当今社会,随着信息技术和计算机网络的迅猛发展,使得文本、图像、视频、音频等数字产品也日益丰富。数字作品的易于无损复制、分发的特性,使得出于各种目的的盗版行为日益猖
培训优秀的科级党员领导干部、乡镇一般干部、村民委主任等,为我国输送优秀的基层人才,推动我国基层建设发展,是我校成立以来就承担的责任.而党十九大的召开,“不忘初心,牢记