论文部分内容阅读
随着语音技术的迅速发展,越来越多的用户有意获取更为清晰的语音系统。在视频、电话会议系统、大型会议室等一些应用场合,需要对感兴趣的声源实现定位和语音增强。传统的单个麦克风在对采集到的语音进行增强算法处理时,容易混入新的音乐噪声且造成信号的失真,不能满足人们对声音质量的要求。麦克风阵列能够自动检测,定位声源的位置,并对噪声信号进行空间滤波,取得更加明显的干扰噪声增强语音的效果。本论文主要研究了基于麦克风阵列波束形成的声源定位算法、语音增强算法以及回声与混响消除算法。论文研究了基于高分辨率谱估计的声源定位技术、基于最大输出功率的可控波束形成定位技术等几种典型的声源定位算法,基于到达时间差(TDOA)定位技术提出了一种改进的定位技术,改进后的声源定位算法能够更加准确地识别声源的位置,提高时延估计的准确性。研究了常规波束形成算法、自适应波束形成算法和后置滤波器波束形成算法,基于后置滤波器法设计出一种基于自适应频谱降噪(ASNR)和多源选择(MSS)的后置滤波器波束形成算法,对算法的性能进行了比对分析。其中常规波束形成法在一定程度上能够实现语音增强,它去除噪声的效果有限且只能消除相干噪声;GSC算法处理的过程中,滤除期望信号估计噪声成分的能力不是很好,影响算法整体的消噪性能;本文提出的基于自适应频谱降噪(ASNR)和多源选择(MSS)的后置滤波器波束形成算法能减少来自中频段和高频段的噪声,也能利用自适应ASNR滤波器减少低频噪声的影响,提高了消噪的性能以及输出音频信号的质量。研究了麦克风阵列混响消除算法与自适应回声消除算法,自适应回声消除算法通过调整自适应滤波器的权值,模拟出一个无限逼近真实回声路径的近似回声路径,得出估计的回声信号,对算法的性能进行了仿真,仿真结果表明使用自适应回声消除算法能够消除语音信号中回声成分,处理效果良好。