论文部分内容阅读
在手机通话、视频多媒体会议和车载系统等语音通信系统中,由于受到环境中背景噪声的干扰,麦克风接收到的语音信号通常伴随着干扰噪声,影响语音的可懂度与舒适度,亦或影响语音处理系统后续处理性能。传统的单麦克风语音降噪方法如维纳滤波算法因其简单高效并有一定的效果而应用广泛,但是应用类似的单通道算法可能会造成信号失真或者引入所谓的音乐噪声,不能满足目前多媒体技术发展的应用需求。因此人们开始研究与应用麦克风阵列语音降噪技术,麦克风阵列在接收语音信号可以同时获得信号的时空信息,算法上能更加灵活的利用这样的信息提高降噪性能,同时还能形成波束对准目标声音源,追踪说话人的位置,从而应用在更多的场合。另一方面,近年来,随着多路或多维数据的发展,张量分析已经在量子物理、文本挖掘、数据分析和图像处理等诸多领域得到广泛的研究及应用。张量可以看作是一个多维的矩阵,它是向量和矩阵高维扩展。张量分析的发展使得人们考虑把信号建模成张量形式,在高维空间中通过张量工具解决信号处理问题,尤其适合于分析和处理多维阵列信号。本文详细的介绍了张量(Tensor)理论基础、麦克风阵列的拓扑结构通用模型(general signal model of microphone arrays,GSMMA)、时延估计技术(time delay estimation,TDE)以及麦克风阵列语音信号降噪方法等技术。其中的麦克风阵列语音信号降噪方法,首先介绍了目前已有较为成熟的固定波束形成技术、基于GSC理论原型的自适应波束形成方法和阵列子空间语音降噪方法的原理,并进行了仿真和比较分析。然后,基于张量代数分析方法,探索由通道、时间和频率三个维度将麦克风阵列语音信号建模成张量形式,通过Tucker分解和交替最小二乘法(alternating least squares,ALS)等张量分析工具建立多模滤波器,实现通过三种不同的多模滤波方法进行噪声的滤除或抑制,同时介绍以张量预处理与阵列子空间方法结合的方式进一步提高降噪性能,最后进行仿真分析,算法在整体上均取得了较好的语音降噪效果。本文的研究可为将来进一步在高维空间实现更好的语音降噪效果提供有益的参考。