论文部分内容阅读
语音在生活中是最重要的交流方式之一,但是环境中充斥着各种噪声,严重影响语音质量,因此语音增强技术愈发重要。单通道语音增强作为目前最为成熟的语音增强算法,在复杂环境中难以取得理想的效果。而麦克风阵列可以得到语音信号的空时信息,有较高的空间分辨能力,因此在语音增强领域得到广泛应用。但由于先验参数估计不准确的影响,麦克风阵列语音增强的性能依然受到制约。为此,本文以环形麦克风阵列为基础,研究了一种基于最小方差无失真响应的波束形成算法(MVDR)和它的后置滤波系统。现有的MVDR语音增强系统使用自适应方式更新噪声协方差矩阵,使用相位加权广义互相关方法进行导向矢量估计,在复杂环境下性能恶化较快。为此,本文从两方面进行改进,一方面借鉴雷达波束形成中的采样矩阵求逆思路,并采用动态平滑更新的方式计算噪声协方差矩阵,保证噪声协方差矩阵估计的稳定性,在此基础之上分析动态对角加载技术和固定对角加载技术的优缺点和实用性,选择使用固定对角加载技术增强系统的鲁棒性;另一方面,基于目前复杂环境下导向矢量估计准确性严重下降的问题,利用噪声主要污染共振峰这一现象,通过使用线性预测残差的希尔伯特包络来进行时延估计,消除了由噪声带来的误差,提升了时延估计的准确性。实验对比证明,改进的时延估计方法可以在较低信噪比的情况下依旧保持较低的误差率,改进的波束形成系统PESQ评分提升1.0左右,字错误率下降到1.42%左右,即便在低信噪比情况下也取得较好效果。经过波束形成之后语音仍有残余的相干噪声和非相干噪声,此时需要引入维纳后置滤波进行进一步处理。现有维纳后置滤波器多假设噪声场为非相干场,且对全频段内采用相同加权。本文针对实际噪声场为散射噪声场,噪声在低频处相干性强的特点,引入散射噪声场相干函数进行期望信号和噪声信号的估计,然后引入双参数使维纳滤波器动态可调,在低频段以输入分段信噪比为依据进行动态更新,使维纳滤波器可以根据频率和信噪比进行自适应更新,在高频段采用传统维纳滤波器进行更新,使增强后的语音的在尽可能低失真的情况下实现残余噪声的抑制。实验对比证明,改进后置维纳滤波器低频处噪声明显减小,语音失真无显著增大,PESQ评分得到了提升。改进后的环形麦克风阵列语音增强系统采用了更具有鲁棒性的参数估计方法和适用于散射噪声场的双参数可变维纳滤波器,同时将单通道、窄带信号处理方法拓展应用于多通道、宽带信号处理,具有较好的创新性;其使用了市面常见的环形麦克风阵列,在多种噪声和信噪比下都表现出来不错的性能和较强的稳定性,在尽可能减少语音失真的情况下降低了噪声,具有较好的应用价值。