麦克风自适应算法在鲁棒语音合成中的研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:zhangyuhan13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,当使用基于大规模语料库的合成方法时,通常采用高质量构建的合成语音库,以此来保证合成语音达到非常理想的状态。所以现有的语音库为了进一步提高合成语音的效果,其创建的要求也在进一步严格中。这样,不仅要扩大存储空间来适应更大规模的语音库,而且对录音环境的高要求也进一步加重了语音合成的成本问题。随着眼下互联网的高速发展,网络上可以直接下载到的数据资源日益丰富,比如国内外各广播电台和电视台的新闻播报,并且其对应的文本也非常准确。如何将这些语音资源顺利地应用于自动语音库的创建中,必然可以有效降低语音合成的成本。但是,这类易获得的语音资源大都不是特别干净,存在录音条件不连续,录音条件多变,存在少量的背景噪声等等多种因素的干扰。对此,本论文在鲁棒语音合成方面进行了相关研究,根据目前语音识别中流行的抗噪声技术,针对网络语音库存在的噪声问题做出了系统的分析,提出了麦克风自适应算法来有效提高合成语音的质量,具体的工作和研究成果如下。1)全面的分析了形成噪声的原因,对网络语音库中存在的主要噪声情况进行归类,通过对现行语音识别中已经比较成熟的噪声处理方法的归纳总结提出,由麦克风因素引起的噪声主要可以通过倒谱域的特征规整方法进行处理。研究还发现,基于HMM(Hidden Markov Model)的统计参数语音合成方法对噪声有更好好的鲁棒性,深入的讨论了这种可训练参数的合成系统优于单元挑选方法的具体原因。本论文在使用国际上通用的MOS评分方法来对合成系统做出性能评测,由于MOS方法属于主观评测,所以本文还参考了MCD值计算频谱偏移的方法,来客观的分析噪声对系统的影响。2)本论文采用对纯净语音数据进行HRTF滤波,来模拟网络获取语音所存在的麦克风因素影响。这是由于如果直接采用网络语音进行实验,可能会存在语音样本种类单一的问题,不能覆盖所有可能出现的麦克风噪声情况;而如果采用极端录音的方式才模拟训练数据,又会受到太多未知因素的干扰。所以本文使用了头相关传输函数的处理,来模拟网络语音。由于这种方法为纯净语音库和含噪声语音库的训练数据提供了在时长与内容的完全一致性,所以可以更好的比较两种语音库合成语音的效果,分析噪声对合成语音造成的相关影响。本文共创建了两个含噪声语音库,它们的区别在于包含麦克风影响参数的个数是不同的,可以观察到,麦克风因素的增加造成了合成语音自然度的明显下降。3)本文提出了一系列的麦克风自适应算法来解决含噪声语音库的合成效果下降问题。实验表明,最终HTS系统合成语音的MOS评分和MCD结果基本一致,在经过自适应算法的处理后,利用含噪声数据集合成语音的自然度与可懂度都有了明显的提升。同时,相比CMN与RASTA方法,MVN方法在处理麦克风噪声问题方面最为优秀。
其他文献
短波通信具有传播距离远,成本低廉以及抗摧毁性强等优点,使得其在远程通信特别是军事通信中有着举足轻重的作用,然而由于短波信道存在严重的多径时延、多普勒效应以及带内干
情绪是人类体验的外在表现,是一切心理活动的内在背景,对人的行为习惯产生重要的影响。同时,情绪状态也属于心理状态的一部分,良好的情绪状态对大学生身心健康的发展和行为机
毫米波辐射成像技术在遥感、盲降、导航、安检等军事、民事应用领域具有重要的实用价值。但是由于受天线孔径等原因的限制,使获得的毫米波辐射图像模糊、空间分辨率不高,针对
无线人体局域网(WBAN:Wireless BodyArea Network)技术是微传感技术、生物医学技术和无线通信技术的融合,其低功耗、高可靠性、高数据速率等特点使其成为医疗界、商业界和学术
针对当前用于人体违禁物品探测的被动毫米波成像的图像质量差、目标检测仍基于人的主观判断的现状,本文对自动检测并识别毫米波图像中违禁物品的方法进行了研究,提出采用Haar
现代社会中,越来越多的人受到心理压力的困扰,不同程度的心理压力会对人产生生理和心理上的影响。此外,长时间的心理压力还可能引发抑郁,从身体和心理上给人带来极大的痛苦和
机载合成孔径雷达(SAR)成像与地面运动目标的检测技术是现代雷达技术发展的一个重要方向,无论在军事领域还是民用领域,都具有着非常重要的意义。论文结合了分数阶傅里叶变换
随着移动通信和无线因特网需求的不断增长,对更为先进的无线传输技术的需求越来越大,无线通信领域的研究一直致力于开发具有更高频谱利用率和更高性能的通信方式。多输入多输出
在移动无线通信系统中,由于多径效应和无线信道衰落的影响,产生的码间干扰会导致通信系统的传输效率下降,且信息失真严重。为提高通信质量,需要使用均衡技术对信道特性进行补偿。
随着云计算网络的快速发展,作为云计算基础框架的数据中心网络吸引了来自学术界和工业界的广泛关注,并得到了高速发展。诸如数据收集、视频内容托管交互、社交网络等网络应用