论文部分内容阅读
语音增强作为一种语音预处理技术,已经研究了近二三十年,其目的是抑制带噪语音的噪声,改善语音的清晰度和舒适度。主要应用于语音识别、编码器等语音处理系统中。现有的语音增强算法有很多,主流算法是基于单麦克的算法。基于单麦克的算法主要是短时谱估计算法,短时谱估计算法主要分为:谱减法、维纳滤波法、最小均方误差法等。近期,基于多麦克的语音增强算法开始受到关注。现有的多麦克语音降噪算法主要有:自适应噪声相消算法(Adaptive noise cancellition)、广义奇异值分解算法(Generalized singular valuedecomposition)、Griffiths-Jim波束成型器(Griffiths-Jim beamformer)等。本文重点研究了基于双麦克的语音增强算法,提出了基于独立成分分析的双麦克语音增强算法;同时针对单麦克语音增强算法中的MMSE短时谱幅度估计算法(MMSE-LSA),提出了一种改进算法。首先,研究了基于多麦克语音增强算法,综合考虑了实际的应用背景和现有主要算法的性能及复杂度,引入独立成分分析(Independent componentanalysis)算法,提出了基于频域ICA的双麦克语音增强算法。其次,针对上述算法在分散噪声环境中性能有所下降的问题,将算法模型扩展至带噪信号模型,提出带噪信号的频域ICA算法。有效地提高了算法在分散噪声环境下的性能。针对增强后语音中残留的噪声,利用单麦克中的MMSE短时谱幅度估计算法,处理增强后语音,去除了残留噪声,提高了算法性能。本文对基于独立成分分析算法的双麦克语音增强算法进行了实验验证。与已有的双麦克算法和MMSE-LSA算法进行了比较,实验结果表明基于独立成分分析的双麦克语音增强算法性能明显优于已有算法。最后,针对传统单麦克语音增强算法中的MMSE-LSA短时谱估计算法中存在的高频分量损伤较大的问题,使用谐波恢复,提高了算法性能,对改进算法进行了测试,测试结果表明,改进算法有效地提高了MMSE-LSA算法的性能。