论文部分内容阅读
将人类听觉系统机理应用到机器人领域,不仅可与视觉互补,使得机器人能灵活地处理所处环境中视听信息,且对于智能机器人设计有重要参考价值。声源定位作为机器人听觉系统的主要功能之一,近些年得到学者的广泛关注与研究。它是实现其他听觉功能,如声源分离、语音识别的前提,同时声源定位在人机交互(HMI,Human-Machine Interaction)和人工智能领域也有着举足轻重的地位。本文在研究以往的声源定位系统成果的基础上,深入讨论了麦克风阵列技术;建立了一个以基于Linux系统的树莓派ReSpeaker 4-Mic扩展板为核心阵列的四元十字阵声源定位系统,通过仿真比较波束形成、超分辨率谱估计、到达时延差(TDOA,Time Delay of Arrival)三类算法的性能,采用当前主流的时延估计(TDE,Time Delay Estimation)声源定位算法,并分别在室内和室外不同环境下测试了系统性能和算法精度;最后搭建一个以DSP板ADI-21489和STC89C52联合控制的步进电机转动系统,将声源定位系统移植到机器人头上,实现了机器听觉系统中的声源定位以及机器人头部转动面向声源的功能,系统经过测试获得较好的效果。本文工作和内容如下:(1)介绍了麦克风阵列语音信号处理的关键技术,提出了基于麦克风阵列技术实现机器人听觉系统的方案。(2)设计了一个基于树莓派ReSpeaker 4-Mic扩展板的四元十字型麦克风阵,通过仿真比较波束形成、超分辨率谱估计、到达时延差三类声源算法的性能,综合考虑选择基于到达时延差为系统的最终算法,同时比较了GCC、LMS等时延差定位算法性能,提出了基于最小均方差的改进的时延估计算法,仿真实验表明该算法在室内混响场景下具有较高精度。(3)设计了机器人声源定位系统,将四元十字麦克风阵安装于机器人头部,并通过步进电机实现控制机器人头运动轨迹,实现了机器人声源定位和头部转动面向声源的功能,达到了机器人听觉系统“听声辨位”的指标。(4)总结本文主要研究内容,探讨本文中所实现机器人听觉系统的功能,提出了不足需改进之处。