论文部分内容阅读
在语音和听觉信号处理领域中,如何从多个说话者的混合语音信号中分离出各个语音源信号或提取出人们感兴趣的目标语音,来模仿人类的语音分离能力,成为一个重要的研究问题。 盲源分离(BSS),是指在不知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅由观测信号恢复出各个源信号的过程。通常的盲源分离算法大都要求混合是超完备(overcomplete)或完备(complete)的,即观测信号的数目大于或等于源信号的数目。然而,在实际语音通信过程中,由于实际条件所限,不可避免地会出现观测信号的数目会小于源信号的数目的情况,即欠通道情况。因此寻找有效的欠通道语音盲分离方法具有非常重要的实际意义。 独立分量分析(ICA)是一种有效的盲分离算法,己有不少学者提出了多种有效的ICA算法,但这些ICA算法大多都不考虑欠通道的情况。对于欠通道情况下的盲源分离,经典的ICA算法并不能解决。 本论文在分析和总结前人研究工作的基础上,对ICA的基本理论、经典算法及其在语音信号处理中的应用进行了分析和探讨,针对当前语音分离的研究现状,对欠通道瞬时线性混叠、模拟真实环境下的语音盲分离算法进行了研究和探索。主要进行了以下几种解决方案的研究: 1.提出了一种新的多通道盲分离算法,卷积混合语音进行盲源分离时,不能直接应用ICA算法。首先对卷积混合语音模型进行常规线性转化,然后采用改进时域FastICA的算法进行盲分离,利用聚类和重构机制来恢复源信号。通过真实语音实验表明,文中提出的算法能够有效的分离混合语音信号。 2.详细研究了基于超完备基的独立分量分析(Overcomplete ICA)的自然梯度和最短路径的算法,利用该算法解决欠通道混合语音盲分离的算法。采用最短路径方法来推断源信号和采用自然梯度方法来学习基向量。通过实验证明该算法能很好解决欠通道瞬时线性混合语音盲分离问题。 3.对变换域中的欠通道语音分离技术进行了探索。针对现有的时频域语音分离的研究算法,结合ICA技术、二进制时频掩码技术等,对欠通道混合语音进行了分离实验。 论文最后我们对本课题的研究进行了总结和展望。