论文部分内容阅读
独立分量分析(ICA)是盲分离技术中的一个分支,由于它可以在对源信号和混合系统的先验知识知之甚少的情况下,仅从观测到的混合信号中,利用独立性假设,恢复出源信号,因此在语音分离、无线通信及信息隐藏等多个领域中有着广泛的应用。
语音盲分离是独立分量分析技术一个重要的应用,同时也是难度很大的一个部分。经典的“鸡尾酒会”问题诠释了语音盲分离的任务,即从一个实际未知环境所观测到的混合语音里提取出各个说话人独立的语音。围绕着这个问题,全文的工作与研究如下:
(1)针对早期的瞬时混合模型,分析了目前比较成熟的三类分离算法,这包括:自适应的信息最大化法,固定点中的FastICA法以及批处理中的特征矩阵联合近似对角化法。然后,通过评价标准对三种算法的性能进行了比较,并阐明了三种算法的优缺点。
(2)对简单的瞬时模型进行扩展,提出时变混合系统的概念,并给出分段求解混合矩阵的方法;紧接着,罗列了分段处理时可能遇到的各种新问题,并一一给出解决方案。
(3)对于实际环境中的卷积混合语音模型,本文采用了将时域混合数据通过短时傅里叶变换转换到频域解决的方法,这将导致排序和幅度不确定性问题。对此,本文首先简述了现行的两种方案:频谱分裂及波达方向估计(DOA)。对于这两种方案,通过论文给出的评价标准,描述了其性能参数。在进行对比之后,分析了两种方案的优缺点:频谱分裂法普适性更强,因为其原理基于频率间相干性;而DOA方法的鲁棒性更好,但是其混合模型必需满足麦克风阵列的假设。
(4)在两种现行方案的基础之上,提出了一种改进型的DOA方法,并通过仿真证明了其性能的优越性。