论文部分内容阅读
近年来,语音信号的盲分离成为了盲信号处理领域的一个热点问题,它在语音识别、小型移动通信设备以及远程会议方面有着广泛的应用前景。针对语音信号盲分离的方法主要有独立分量分析(ICA)方法和基于时频分析的时频掩蔽(TF Masking)方法。目前,针对瞬时混合信号的盲分离已经获得了很好的效果,而对于在实际环境中由房间的回响和各种反射造成的卷积混合语音信号,要实现分离相当困难。目前越来越多的研究采用频域上的方法来进行卷积语音信号的盲分离,该方法可以将时域上的卷积问题变换为频域上的乘积问题,这样就可以采用相对成熟的解瞬时混合的ICA方法对混合信号进行分离。与TF Masking方法相比,频域独立分量分析(FDICA)方法优点在于使分离信号的音乐噪声与谱失真较小,但收敛速度不够理想,且存在固有的幅度和次序的不确定性问题。本文将传统的FDICA方法与TF Masking方法相结合,提出了一种新的基于FDICA的卷积语音信号盲分离方法,利用TF Masking的聚类结果对FDICA做初始化,并进一步进行ICA迭代频带挑选,该方法着眼于追求良好分离性能并极大提升运算效率,同时也解决了次序不确定性问题。在此基础上,又通过搭建的多通道数据采集平台,进行了分块在线的盲分离尝试,并针对性的加入了对ICA分离的后处理优化方法,在付出极小运算代价的情况下进一步提升了语音信号分离性能,这也为后续的盲分离系统的研究奠定了基础。具体研究工作包括以下几个方面:第一,为了加深对盲分离的理解与认知,第二章首先介绍了盲信号分离的信号混合模型和麦克风阵列模型,接着采用MLS(Maximum Length Sequence)方法进行了房间声学脉冲响应测量。第三章对ICA的基本概念、数学知识和基本算法做了较为全面的介绍,并且给出了频域卷积混合语音盲分离的概念以及基于信息最大化的FDICA基本算法。第二,在第四章中首先回顾了基于语音时频分析的盲分离算法,为了提升传统FDICA收敛和分离性能,结合TF Masking方法,提出了一种新的基于FDICA的盲分离方法,加快了ICA的收敛速度,并在追求良好分离性能的同时极大提升了运算效率。第三,在第五章中首先利用ASIO驱动实现了多通道同步语音采集平台,该平台将有利于进一步的盲分离研究和盲分离系统的搭建;然后对分块在线盲分离可能存在的问题进行了分析,在第四章的算法基础上提出了针对FDICA的时频掩模后处理方法,从分块在线的实验结果来看,在消耗极小运算量的情况下,后处理方法对于语音信号的分离性能有较明显的提升;经过改进后的整套算法在分离性能和运算效率方面也表现出了很好的性能。这也为后续针对实际应用的盲分离系统的搭建奠定了坚实的基础。