论文部分内容阅读
传统单只麦克风系统只能在时域、频域对语音进行处理,而麦克风阵列系统引入了声源的空间信息,增加了空域处理,可实现声源定位、方向性干扰抑制、语音分离等功能。它可广泛应用于助听器、车载电话、视频会议、语音识别、多媒体教室、战场侦听等环境。目前,基于麦克风阵列的语音处理算法层出不穷,仿真结果证明这些算法的有效性。但在实际应用中,以子空间算法、自适应波束形成算法为代表的麦克风阵列语音定位、增强算法性能不理想。为了提高这些算法在实际应用中的性能,本文对此进行了初步的研究。本文首先阐述了两种典型的麦克风阵列语音定位、增强算法,将它们作为算法性能分析基础。其次研究了造成这些算法性能下降的主要原因,即麦克风阵列误差。利用系统的观点和方法,对其建模。在此基础上,提出了一种包含麦克风阵列误差的改进阵列模型。其次研究了解决方法,即麦克风阵列模型误差校正方法。按照校正声源位置是否已知,麦克风阵列校正方法可划分为有源校正和自校正。利用子空间特性,提出了一种有源校正方法,并在此基础上提出了一种鲁棒的声源定位算法。利用对称性,提出了一种自校正方法。最后给出两种方法的比较和结论。本文的创新点在于:(1)提出了一种改进的麦克风阵列模型。该模型考虑了麦克风阵列幅度、相位以及阵元位置误差,可应用于任意几何形状的平面阵列,可推广到多维阵列。与传统麦克风阵列模型相比,该模型更接近实际情况。(2)提出了一种有源校正方法。该方法可对麦克风阵列幅度、相位以及阵元位置误差进行校正,具有较高的精度。为解决该方法的相位模糊问题,提出了一种改进的模型误差估计算法,并在此基础上,提出了一种鲁棒的声源定位算法。在麦克风阵列存在误差的情况下,该定位算法仍然保持较好的性能。(3)提出了一种自校正方法。该方法不需要校正声源的精确方位,利用对称性,可对麦克风阵列幅度、相位误差进行校正。它具有性能较好,运算量小,方便易行的特点。