论文部分内容阅读
在实际应用环境中,语音往往会受到多种噪声影响,使语音质量严重受损。语音增强的目的是尽可能消除噪声和其他干扰源对目标语音的干扰,提取纯净的目标语音,改善语音质量,提高语音可懂度和舒适度。按照麦克风数目,现有的语音增强算法可以分为单通道语音增强算法、麦克风阵列语音增强算法和双通道语音增强算法三类。通常,基于系统复杂度和系统成本的考虑,小阵列的麦克风语音增强算法更为实用。目前,在智能手机中,大多采用小阵列麦克风语音增强系统。本文主要对面向手机应用的双麦克风语音增强算法进行了研究。首先,论文对语音增强的研究背景、意义和研究现状进行描述,对单通道语音增强算法、麦克风阵列语音增强算法和双通道语音增强算法进行了系统研究,并对三大分类中的经典算法进行了简单的算法原理介绍和性能评价。其次,论文深入研究了基于能量差的双麦克风语音增强算法。该算法原理简单、对时延估计不敏感,并有很好的语音增强效果,比较适合应用于智能手机之中。在传统能量差(Power Level Difference,PLD)算法中,采用固定平滑因子进行信号谱估计,并采用稳态噪声估计方法,致使在高度非平稳环境中,算法性能变得很差。此外,该算法会在对语音处理过程中引入音乐噪声,影响语音的听觉舒适度。基于传统PLD算法中存在的这些问题,本文提出了一种改进的PLD算法。在改进算法中,采用自适应平滑的信号谱估计以改善信号谱估计精度,采用基于标准能量差的噪声谱估计方法以提高非平稳态噪声环境中的噪声估计精度,并结合使用一个后滤波器对音乐噪声进行处理。基于算法思想,论文对传统PLD算法以及文中提出的改进PLD算法通过MATLAB进行了仿真实现。最后,论文对改进PLD算法性能进行了测试分析。为此,分别采用一种单通道谱减算法、传统PLD双麦克风语音增强算法和改进PLD算法对相同的经背景噪声衰减后的语音信号进行处理。对测试结果中的主观语音评估质量(Perceptual Evaluation of Speech Quality,PESQ)和语谱图进行分析比较。分析结果表明,与单通道语音增强算法相比,双麦克风语音增强算法有着明显优势;与传统PLD算法相比,改进PLD算法取得了更高的PESQ值,改善了音乐噪声现象,并使语音听起来更加舒适。此外,改进算法依然存在一定的不足,这将在论文的总结部分进行说明。