论文部分内容阅读
目前,声源定位技术中多采用基于时延估计的声源定位算法,该算法定位精度不高。然而,在很多对定位精度要求较高的场合,比如,在实际会议室内,如果有多个说话人同时说话,声源定位精度高是对每个说话人的语音清晰拾取的保证。因此,提高声源定位精度也是一个很重要的研究课题。本文以基于大中型室内会议厅为场景,以对多个距离相近说话人的准确定位为研究背景,提高声源定位的精度为目的展开的研究。本文主要工作和创新点概括为以下几点:1.对语音信号预处理、预滤波进行仿真分析,目的是将非平稳性和宽带性的语音信号转变成平稳和窄带信号,便于后续定位算法处理。同时分析归纳了声源信号远、近场模型,为后续声源信号建立了空间入射信号模型。2.总结归纳了麦克风阵列的几种基本的拓扑结构:均匀线阵、均匀圆阵、十字阵、任意阵。从理论上给出了影响定位的空间参数。综合易于实现和定位效果两方面因素,选择均匀线阵和均匀圆阵作为研究的基本拓扑结构。同时,定性和定量的分析了阵元间距和外界环境误差对声源定位精度的影响,为后章节提供分析依据。3.为了满足大型室内会议室中,对说话人更为精确的定位,同时,也考虑定位模糊引起的定位失真。本文提出了一种具有两个不同阵元间距的麦克风阵列定位方法。该方法分别采用不同的阵元间距的线性组合,提取接收到的一帧最优化后的声源信号,对同一声源进行两次定位。后一次定位是依赖于前次结果而设置定位参数,此后采用2D-MUSIC算法进行精确定位。通过仿真分析,该方法不仅使得定位精度得到了有效的提高,同时,对空间相距很近两声源可以达到很精确的分辨。此外,为了后续方便研究,本文搭建了该方法的仿真验证系统,进一步验证了该方法的实用价值。4.基于上述麦克风阵列拓扑结构下,声源的二次定位算法在环境误差较大时,定位精度提高的同时可能会造成定位结果不准,因此,根据麦克风阵列校正的理论,本文最后对上面提出的二次定位算法做了进一步的修正,即对理想情况下,定位的空间结构乘以一个线性误差修正函数,使得麦克风阵列理想接收模型更加接近于实际接收模型,从而提高定位结果的可靠性。最后本文通过仿真验证了修正后可以达到较好的定位效果。