汉语基元音素独立分量谱分析对比及语音合成研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:shao402248950
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成技术是实现人机语音交互通信的关键技术之一,它希望计算机具备像人一样的说话能力。能灵活调整合成单元的音段参数和超音段参数,同时确保合成语音的高自然度是目前面临的一个主要问题。   独立分量分析方法区别于传统的DFT、小波变换等分析方法,论文利用独立分量分析方法的优势,提取基元独立分量,分析其声学特征并结合语音合成展开探索性研究。   论文应用独立分量分析方法,研究汉语发音基元时域和频域独立分量信号可区分的声学特征,结合基元生物发声机理讨论各独立分量的含义;对比分析基元独立分量传统短时FFT谱包络与LPC声道谱包络、高阶wigner-Ville谱包络声学特性,研究分析在基元合成实验中的合成效果:通过基频曲线调整合成基元调域,对独立分量谱包络按共振峰特性加窗处理和调整各独立分量间混合权重来控制合成基元音色。   论文的主要工作如下:   1、论文使用独立分量分析方法,从时域提取各发音基元独立分量。对比分析了基元各时域独立分量间相关性大小、基频F0曲线、共振峰特性、F1-F2,F2-F3声学音位图等声学特征,发现基元各时域独立分量间可区分的特征。结合各发音基元的生物发声机理,声带的振动频率与基频对应,元音发音时舌位的高低与第一共振峰频率F1对应,舌位的前后与第二共振峰频率F2对应等,将基元各时域独立分量进行鉴别区分,赋予各独立分量确切的含义,如高基频分量,高舌位分量,前舌位分量等。   频域ICA分析中,获取了基元频谱包络的独立分量。对比分析了蕴含在基元各频谱独立分量中的共振峰特性和F1-F2,F2-F3声学音位图,找出基元各频谱独立分量间可区分特征,将基元各频谱独立分量分别区分为高舌位谱分量,前舌位谱分量等。   2、在时域ICA分析中,对同一发音基元各时域独立分量,提取了其传统短时FFT谱包络与LPC声道谱包络、高阶Wigner-Ville谱包络,对比分析了蕴含在三种频谱包络中的共振峰特性和谐波结构,发现三种频谱包络间的声学特征差别;对比分析了传统短时FFT谱包络与LPC声道谱包络、高阶Wigner-Ville谱包络在基元合成实验中的效果。   实验环节,应用STRAIGHT合成算法,基于各基元独立分量的基频和三种不同的频谱包络,完成了各发音基元时域独立分量合成和时域独立分量混合合成实验。基于各基元三种不同频谱包络的谱独立分量,完成了基于谱独立分量的基元合成和基于谱独立分量混合的基元合成实验。   实验结果表明,三种频谱包络有各自不同的声学表现,基元LPC声道谱包络表现出了较平缓的声道传输特性,共振峰结构较钝化,而WV谱包络拥有更加丰富的谐波特性,更尖锐的共振峰结构和更高的频率分辨率,信号的一些快速时变特征在WV谱包络上也有体现。从基元合成效果来看,WV谱合成基元清晰度可懂度较优,传统FFT谱合成效果次之。   3、论文针对各发音基元时域独立分量的谱包络按第一、二共振峰特性进行加窗处理,获取不同的音色表现。将不同特性的独立分量按不同的权值加权组合产生出音色可调控的合成语音,通过基频曲线调整合成基元的调域音高和情感特征。   论文实验总结得到了音色调整的规则1、规则2和规则3,用来调控合成语音的基频和频谱包络中共振峰特性。   实验结果显示,谱包络的加窗处理对音色的调整可控制在一个较满意的范围内,没有出现合成语音清晰度可懂度急剧下降的情况。经加权混合处理后的合成基元效果比音色相对单纯的各独立分量合成基元信号有更丰富的表现力,但音色的调整处理基于独立分量进行,对合成音质的影响会更细腻一些。合成基元清晰度可懂度经MOS评测,时域独立分量基元合成平均得分在4.5,时域独立分量谱加窗基元合成半均得分在4.53,时域独立分量加权混合基元合成平均得分在4.8左右。基于谱独立分量的基元合成平均得分在4.45,基于谱独立分量混合的基元合成平均得分在4.6左右。  
其他文献
随着通信产业对“移动通信宽带化”的认识和应对“宽带接入移动化”挑战的需要,“长期演进”的进程应运而生。从HSDPA到HSUPA,3GPP一贯推行后向兼容的稳健演进路线,在移动通
目的:近年来,越来越多的研究表明,间歇性低氧(intermittent hypoxia, IH)处理可提高心肌抗缺血、缺氧能力,具有明显的心脏保护作用。我们前期的研究显示,给予大鼠28天相当于
红外探测技术以其被动式工作、抗干扰性能高、目标识别能力强、作用距离远、全天候工作等特点,已广泛应用在军事、工业、农业、医疗、消防等领域。红外热像系统以红外探测技
近年来随着科学技术的发展,对时间频率的精度有着更高的要求。与此同时,伴随着扩频技术的不断提高,利用卫星进行时间频率传递得到了广泛的应用。卫星双向法时间频率比对技术
随着现代多媒体技术的发展,人们借助于网络很方便的就可以实现信息传输,但是它在给人们带来便利的同时也带来了信息安全问题,特别是数字媒体的版权纠纷问题。一些人很容易从
传统的卫星地面综合测试系统通常采用带有分离插头的电缆网来连接卫星和地面测试设备,随着当今微纳卫星的发展,这种基于有线方式的卫星地面测试模式已无法满足当今微纳卫星的快
目的:经皮腔内冠状动脉成形术(percutaneous transluminal coronary angioplasty, PTCA)是目前治疗冠心病的安全、有效方法之一。但其远期效果受到局部血管再狭窄(restenosis, RS)的影响。旋覆花素(1-o-acetylbritannilactone, ABL)作为一种具有消炎、镇痛、活血化瘀功效的天然有效成份,以往体外实验结果表明, ABL对
近年来,随着遥感技术的快速发展,遥感卫星数据下行码率越来越高,为降低星地链路传输带宽需求以及提高信号传输可靠性,星上往往采用专用集成器件(ASIC)对获取的遥感图像进行复杂的
背景与目的:  副交感神经递质乙酰胆碱(acetylcholine,ACh)可通过乙酰胆碱毒蕈碱受体(M受体,mAChRs)稳定地激发胰腺腺泡细胞产生典型钙振荡(ACh-induced pancreatic acinar cell ca
核电站在运行时会产生大量的放射性物质,核电站设计和建造的首要考虑就是无论在正常运行还是事故下,都要把产生的放射性物质安全的控制起来。辐射监测是对核电站的放射性进行有