论文部分内容阅读
目前大多数语音增强方法都是基于麦克风的,如维纳滤波法、基于小波分析的增强方法等,然而,麦克风语音容易受到环境噪声的干扰,从而影响增强方法的降噪效果,尤其是在低信噪比环境下,此类增强方法性能下降明显。为改进单数据流增强方法的不足,本文提出了一种自适应双数据流语音增强方法。首先,利用麦克风语音和喉部送话器语音的融合特征,建立先验高斯混合模型(Gaussian Mixture Model,GMM)和带噪语音GMM用于构造自适应MMSE滤波器进行滤波降噪;然后,通过先验模型将喉部送话器语音进行高频修复,并将其与滤波语音进行自适应加权融合,对后者二级增强,解决低信噪比时滤波效果欠佳的问题。全文的主要研究工作包括:1.概述本文的研究背景、实际意义以及国内外语音增强技术的发展历史和研究现状;2.介绍了几种基于麦克风的语音增强方法并对其仿真分析,对非空气传导语音的特性及其应用进行阐述。3.提出一种自适应双数据流语音增强方法,并对算法进行实现。首先,使用HTK工具包训练倒谱域模型,包括噪声信号GMM和双数据流干净语音GMM,然后计算其先验模型以及双数据流带噪语音GMM识别模型用于构造维纳滤波器,在滤波时对数据流进行分段自适应加权处理以提高模型识别准确率,获取更好的增强效果。实验通过对自适应双数据流GMM增强方法进行仿真分析,证明了该方法的增强效果比传统麦克风语音增强方法、单数据流GMM增强方法都要好。4.由于自适应双数据流GMM增强方法在低信噪比情况下输出语音表现较为较闷,增强效果不够理想,因此,本文利用先验模型将喉部送话器语音进行转换,修复其高频分量,然后将其与滤波语音自适应加权融合,对后者进行二级增强,提高低信噪比时滤波语音的效果。实验证明融合后的语音具有更好地可懂度和自然度,其PESQ得分有所提高。