论文部分内容阅读
本文对实际环境下的卷积语音信号分离问题进行了深入研究。根据实际环境下所采集的语音信号的特点提出了一种基于语音时频稀疏特性的盲分离算法。
首先,根据语音信号在实际环境中传播时存在多径效应以及各路反射信号之间产生时延差异的特点,提出了种新的用于描述实际环境下的语音信号的卷积混合矩阵模型;进一步,利用语音信号频谱中普遍存在的谱稀疏特性,通过对两路接收信号语谱图的对比分析得到上述模型中的时延参数和幅度系数的待定值;然后,从极大似然估计的思想出发,采用时延对比函数和幅度对比函数作为各参数对的可信度函数,利用改进的K均值聚类方法对参数进行分组和挑选以确定混合矩阵的真实参数的估计值。与现有的基于独立性假设的盲分离算法不同,本算法利用了语音信号频谱中普遍存在的时频稀疏特性,能够解决大多数场合下的盲源分离问题。此外,由于所提出的算法本质上是一种非迭代算法,且不存在发散问题,故具有快速、稳定的特点。仿真实验和在实际环境下的实验结果表明,该算法能在各种信噪比的条件下准确地估计出随环境因素变化的时延和幅度参数,从而据此成功实现对源语音信号的分离,是一种面向真实环境下语音盲分离应用的有效算泫。