麦克风阵列的校正方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:spflying2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统单只麦克风系统只能在时域、频域对语音进行处理,而麦克风阵列系统引入了声源的空间信息,增加了空域处理,可实现声源定位、方向性干扰抑制、语音分离等功能。它可广泛应用于助听器、车载电话、视频会议、语音识别、多媒体教室、战场侦听等环境。目前,基于麦克风阵列的语音处理算法层出不穷,仿真结果证明这些算法的有效性。但在实际应用中,以子空间算法、自适应波束形成算法为代表的麦克风阵列语音定位、增强算法性能不理想。为了提高这些算法在实际应用中的性能,本文对此进行了初步的研究。本文首先阐述了两种典型的麦克风阵列语音定位、增强算法,将它们作为算法性能分析基础。其次研究了造成这些算法性能下降的主要原因,即麦克风阵列误差。利用系统的观点和方法,对其建模。在此基础上,提出了一种包含麦克风阵列误差的改进阵列模型。其次研究了解决方法,即麦克风阵列模型误差校正方法。按照校正声源位置是否已知,麦克风阵列校正方法可划分为有源校正和自校正。利用子空间特性,提出了一种有源校正方法,并在此基础上提出了一种鲁棒的声源定位算法。利用对称性,提出了一种自校正方法。最后给出两种方法的比较和结论。本文的创新点在于:(1)提出了一种改进的麦克风阵列模型。该模型考虑了麦克风阵列幅度、相位以及阵元位置误差,可应用于任意几何形状的平面阵列,可推广到多维阵列。与传统麦克风阵列模型相比,该模型更接近实际情况。(2)提出了一种有源校正方法。该方法可对麦克风阵列幅度、相位以及阵元位置误差进行校正,具有较高的精度。为解决该方法的相位模糊问题,提出了一种改进的模型误差估计算法,并在此基础上,提出了一种鲁棒的声源定位算法。在麦克风阵列存在误差的情况下,该定位算法仍然保持较好的性能。(3)提出了一种自校正方法。该方法不需要校正声源的精确方位,利用对称性,可对麦克风阵列幅度、相位误差进行校正。它具有性能较好,运算量小,方便易行的特点。
其他文献
直流电动机具有良好的起制动性能,能大范围内平滑调速,因而在可控的电力拖动领域中得到了广泛的应用。但传统的直流调速系统所采用的是由分立元件构成的复杂PID模拟控制系统,在可靠性和灵活性以及控制性能都存在不足。针对直流电机的数字控制方式,国内外学者进行了大量的研究并取得了许多成果,控制技术日趋成熟。本文正是基于这一点设计了一种以DSP为主控芯片的数字控制系统,以替代传统的PID模拟控制,实现电流与速度
随着光纤通信系统向着高速率、长距离的方向发展,单模光纤中偏振模色散(PMD)的问题变得越来越突出,成为限制高速率、长距离光纤传输的重要因素。偏振模色散引起数字传输系统
Ad Hoc网络是一种特殊形式的无线数据通信网,它不需要依赖于任何固定的网络基础设施,Ad Hoc网络以其灵活、健壮、投资少等特性,广泛适用于作战指挥、抢险救灾以及应付突发事
期刊
无线点菜系统作为餐饮服务管理系统的一个子系统,旨在降低餐饮服务的人力成本并提高服务质量和效率。它向服务人员提供一种手持终端,以终端操作代替纸质记录和人力工作的方式
三维面形测量在机器视觉、工业在线检测、实物仿型、地质勘探等多个领域具有重要的意义。基于傅里叶变换轮廓术的三维面形测量技术是三维传感中应用较为广泛的一种方法。本课
期刊
人们打电话时有时会听到自己的声音,这是由于通话中回波的存在。回波是固定存在的,只是能量大小,时延长短有别。当它达到一定能量与时延门限时,就会对通话造成干扰。随着人们对通
期刊
数字图像修复是指对数字图像中丢失或破损的部分进行还原修复的过程。通过对破损的图像进行修复更新,使得图像有更好的视觉效果,达到以假乱真的目的。目前,数字图像修复技术