自适应双数据流语音增强方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:mdyd888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前大多数语音增强方法都是基于麦克风的,如维纳滤波法、基于小波分析的增强方法等,然而,麦克风语音容易受到环境噪声的干扰,从而影响增强方法的降噪效果,尤其是在低信噪比环境下,此类增强方法性能下降明显。为改进单数据流增强方法的不足,本文提出了一种自适应双数据流语音增强方法。首先,利用麦克风语音和喉部送话器语音的融合特征,建立先验高斯混合模型(Gaussian Mixture Model,GMM)和带噪语音GMM用于构造自适应MMSE滤波器进行滤波降噪;然后,通过先验模型将喉部送话器语音进行高频修复,并将其与滤波语音进行自适应加权融合,对后者二级增强,解决低信噪比时滤波效果欠佳的问题。全文的主要研究工作包括:1.概述本文的研究背景、实际意义以及国内外语音增强技术的发展历史和研究现状;2.介绍了几种基于麦克风的语音增强方法并对其仿真分析,对非空气传导语音的特性及其应用进行阐述。3.提出一种自适应双数据流语音增强方法,并对算法进行实现。首先,使用HTK工具包训练倒谱域模型,包括噪声信号GMM和双数据流干净语音GMM,然后计算其先验模型以及双数据流带噪语音GMM识别模型用于构造维纳滤波器,在滤波时对数据流进行分段自适应加权处理以提高模型识别准确率,获取更好的增强效果。实验通过对自适应双数据流GMM增强方法进行仿真分析,证明了该方法的增强效果比传统麦克风语音增强方法、单数据流GMM增强方法都要好。4.由于自适应双数据流GMM增强方法在低信噪比情况下输出语音表现较为较闷,增强效果不够理想,因此,本文利用先验模型将喉部送话器语音进行转换,修复其高频分量,然后将其与滤波语音自适应加权融合,对后者进行二级增强,提高低信噪比时滤波语音的效果。实验证明融合后的语音具有更好地可懂度和自然度,其PESQ得分有所提高。
其他文献
阻变存储器因其读/写速度快,微缩能力强并与传统的CMOS工艺相兼容等优点,而被认为是最具潜力的下一代非挥发存储技术之一,受到工业界和学术界的广泛关注。随着集成密度的提高
颜元是清初著名的思想家、哲学家和教育家,他突破理学桎梏,以“实学”、“习行”为学术根本,以经世致用为主要目标,以“六德”、“六行”、“六艺”为主要内容,形成了独具特
随着城市信息化进程的加快,信息与市场的联系越来越紧密,道路运输业所涉及的管理业务范围和获取的信息量也将迅速猛增;企业和个人对信息的需求量也会随着城市信息化的普及而
干扰对齐技术是无线网络中一种新兴的干扰管理技术。已存在关于干扰对齐的研究工作大多是基于对称多用户网络展开的。然而,在实际无线环境下,对称性的网络结构要求难以满足。
颜色恒常性作为人类视觉系统最基本、最重要的功能之一,是人类能稳定精确地感知世界的重要保障。具体地讲,当照射物体表面的入射光照颜色发生变化时,人类对该物体颜色的知觉
在商业银行的众多业务之中,风险较高、决策困难及管理难度高的为信贷管理系统,但其也是银行最重要的利润来源,因此信贷业务是银行工作的重心。对于信贷业务而言,其涉及到的环
汽包是自然循环锅炉的重要组成部分,在火电机组长期运行过程中,复杂的工况以及汽包内部汽水工质和壁面间换热强弱的差异引起汽包内外壁温差不断变化,从而使得汽包承受交变的
电力行业的信息化水平是当今能源行业的先驱。近年,随着国内电力行业的快速发展和崛起,我国对电力市场营销服务水平的要求也越来越高。在这样的市场背景下,运用全新的计算机
脑机接口(BCI)可以在不依赖于肌肉组织的情况下,直接通过采集脑信号并转化为相应的机器命令去控制外部设备,从而完成人机交互的过程,这为有运动障碍的残疾人提供了一种与外界
异构无线网络融合是未来移动通信网络发展的一个必然趋势,而异构无线网融合环境下终端接入选择目标为:在多个重叠覆盖的无线网络环境之中,根据当前网络的性能状况、终端自身