论文部分内容阅读
盲源分离是用于阵列信号处理与分析的一种新兴技术,因其能够从观测的混合信号中恢复出原始信号,而对原始信号和混合系统的先验知识要求甚少,故此在无线通信、医学信号处理、图像增强和语音分离等诸多领域有着广泛的应用。 混合语音信号的分离是该技术的研究初衷,也是信号处理领域中的一个难题,涉及问题很多,方法各异。本文简要概括了语音盲分离的基本理论和典型算法,并以此为基础,所做的工作包括如下两方面: 现有的语音盲分离算法都是针对说话人个数已知且在分离过程中恒定的情况,而现实中说话人个数可以是时变的。本文提出一种解决方案,仅用两个麦克风对说话人个数时变的语音信号进行盲分离,不仅能反映说话人个数时变的过程,而且解决了麦克风与说话人之间个数差异引起的超定、欠定问题。其主要思想是:首先,判断说话人个数的变化情况。综合比较几种说话人个数的判断方法后,本文选取一种实时性能较好且易于实现的互功率谱相位法来反映说话人个数的变化过程并按照说话人个数不同,将采集的混合信号分段;其次,对各段分别做盲分离处理。由于说话人个数和麦克风个数存在差异,它们不能始终维持正定情况,所以本文借鉴了超定情况下的盲分离算法DUET;最后,本文提出设想,将各段处理结果用说话人识别技术整合,从而解决了说话人个数时变的语音盲分离问题。 此外,本文还用所提出的方法对盲定位进行了研究。基于互功率谱相来确定信号源到两个麦克风的距离差双曲线,用DUET求解波达方向角。联立曲线和方向角实现多信号源盲定位。因为仅用了两个麦克风,所以定位结果是多个解,本文又结合声音传播规律和余弦定理去除了虚定位。最后用定位结果来指导盲信号分离,实验效果证明了算法的有效性。