基于韵律联合短时谱的说话人变换

来源 :苏州大学 | 被引量 : 0次 | 上传用户:lghlgh82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人变换是一项改变说话人声音特征的技术,是将源说话人的语音特征转换成目标说话人的特征,使得听起来象是目标说话人的语音,而保持源说话人的语义信息内容不变。这个研究涉及到语音分析,语音编码,语音合成,语音增强,语音识别等各个方面,在军事,娱乐,教育等领域也有重要的应用,课题研究主要包括:(1)研究了一种韵律联合短时谱的转换方法。此方法利用一个基于高斯混合模型的转换函数,将每一帧语音信号的LSF系数和基音周期同时作为特征向量代入GMM模型,从而实现谱包络和基音周期的联合转换,再将转换出来的基音周期对源说话人的残差进行修正,最后合成出语音。该方法包括分析、转换和合成三个步骤。(2)研究了在各类不同参数下的转换结果,对于转换后的语音也进行了主观及客观评测,得到了最为优化的一组参数,并且将本方法与传统方法从4个转换角度作出比较。系统改进后对转换后语音进行评测可以看出,在主观方面,转换后效果提升了11.7%的,而在客观方面,也可发现性能有6.7%的提升。这表明改进后的系统相对于传统方法转换性能得到了改善,转换后语音的自然度,可懂度,倾向性也有所提高。证明本方法对说话人转换系统性能的提高是有效的。
其他文献
直接序列扩频信号由于具有被截获的概率低、抗干扰能力强等优点得到了普遍应用,尤其是在军事通信方面。对于非协作通信条件下的直扩信号进行检测侦查,是通信对抗领域的重大课题
无人机是“无人驾驶飞机”的简称,被誉为现代战场的“千里眼”和“杀手锏”,无人机自动着陆控制十分重要,为使无人机准确着陆,必须保证正确识别机场跑道,跑道识别是以摄像机
本文提出基于PDA移动平台的视频监控方法,改善了传统固定、集中式的监控方式,实现了在无线局域网内随时随地的监控,有利于提高实际的监控力度和灵活性。 针对数字视频监控中
二维码技术,是近几年来国际上流行的数据防伪、携带、传递的高技术先进手段,具有信息容量大,编码范围广,保密、防伪性好、译码可靠性高、纠错能力强,制作容易且成本低等优点,即将取
超宽带通信技术是一种新兴的短距离无线通信技术,它利用纳秒至皮秒级的非正弦波窄脉冲传输数据,具有传输速率高,安全性好,抗多径能力强以及精确的定位能力等许多优点,特别是
H.264/AVC是ITU和ISO最新的视频标准,与现有的视频标准相比,H.264/AVC编码器能在保持相同图像质量的情况下节省大约50%的码率。由于其良好的压缩效率和网络适应性,H.264/AVC将在
近年来,人们对无线数据和多媒体业务的需求迅猛增加,促进了宽带无线通信新技术的发展和应用。正交频分复用 (Orthogonal Frequency Division Multiolexing,OFDM)技术已经广泛应
卫星导航定位一直是一个研究的热点,它能够为全球范围的陆地、海上、空中及空间各类用户提供全天候、全天时地连续实时的高精度三维定位、三维测速和精确的时间信息,具有十分广
期刊
期刊