论文部分内容阅读
在室内和车内等声学环境密闭的地方,麦克风采集到的语音信号中会包含混响噪声。作为语音增强的一个重要组成部分,语音去混响算法可以为语音识别等技术进行预处理,去除语音信号中的混响噪声,提高语音信号的质量和可懂度。本文基于多通道线性预测(MCLP)语音去混响算法,做了如下几部分的研究:(1)分析了传统的加权预测误差(WPE)算法。传统的WPE算法是对期望的原始语音信号的短时傅里叶变换系数进行统计建模,发现其符合时变高斯模型,然后利用最大似然估计的方法求出期望语音信号。改进的算法是利用更能逼近真实语音信号的广义高斯分布先验概率模型来估计期望语音信号。本文研究改进型WPE算法发现,在利用最大似然估计法求未知参数时,对概率模型方差的估计不够准确。因此引入了非负矩阵分解方法,利用I-S散度求解非负矩阵分解优化的方差参数,从而提高了去混响效果。(2)根据原始语音信号的稀疏特性,利用稀疏重构的方法求解WPE算法中的预测滤波器系数。方法是将期望语音信号改写为稀疏表示模型,利用迭代加权最小二乘(IRLS)算法求解目标函数。本文研究了该算法的求解过程,发现如果麦克风矩阵比较紧密,会导致观测矩阵产生奇异值,降低稀疏表示模型的精度,因此本文考虑引入正则项约束原稀疏表示模型。再分析了岭回归模型和套索回归模型的优缺点后,本文采用弹性网(Elastic Network)回归模型对原目标函数进行约束。最后通过MATLAB仿真实验验证上述两种改进算法的去混响效果。利用镜像声源模型算法模拟出不同程度的房间冲激响应,与原始语音信号进行卷积得到混响语音信号,利用上述算法对混响语音信号进行去混响处理。通过评价增强语音信号的去混响效果,可以看出本文提出算法改善了原算法的去混响能力。