论文部分内容阅读
语音是人类进行信息传递和交流的重要载体,语音的质量能否得到保证不仅会影响到人耳的听觉效果,还会影响到语音处理系统的各个环节。在实际环境中,由于各种类型干扰的存在,语音信号往往会受到各种各样的污染,造成语音质量的明显下降。语音增强则是以去除各类干扰为出发点,尽可能地恢复出原始的纯净语音信号。针对不同类型的干扰,会有不同的语音增强方法。用于去除语音干扰的语音分离技术是当前语音增强研究领域的热点之一。本文主要研究多语音分离语音增强问题,具体包括以下三方面内容:(1)基于独立分量分析的语音信号盲源分离方法。在观测信号个数不少于源信号个数的情况下,采用独立分量分析技术可以很好地解决盲源分离问题,有效去除语音干扰。独立分量分析技术的核心在于对解混矩阵(混合矩阵的逆矩阵)的求解,源信号则是通过解混矩阵与观测信号向量直接相乘求得。本文在独立分量分析快速算法的基础上,研究了更为有效的改进型快速算法和结合语音信号短时平稳性的改进算法,以提高解混矩阵的精度及源信号的恢复质量。(2)基于聚类的欠定盲辨识方法。对于观测信号个数少于源信号个数的欠定盲源分离问题,独立分量分析方法不再适用,此时估计系统混合矩阵需要利用源信号的稀疏性。本文研究了基于聚类的欠定盲辨识算法,给出一种采用迭代自组织数据分析技术来估计混合矩阵的方法,并采用去除野点的预处理步骤及逐步去除类中最大偏差样本点的后置处理步骤,进一步提高了算法的稳定性和混合矩阵的估计精度。(3)欠定语音信号分离的逐层分离方法。在欠定盲源分离问题中,通常利用源信号的稀疏性,采用统计学的方法来分离源信号。由于语音信号本身的稀疏性还不够理想,并不严格满足正交不重叠条件,因此分离出的源信号之间存在相互干扰和音乐噪声比较明显。本文通过对混合矩阵进行逐次变换,采用从混合信号中逐步消去各个源信号,并由各混合信号中逐次产生的零值点来构造多层二值掩蔽模板的方法,将源信号进行逐层分离,在一定程度上抑制了分离出的源信号之间的相互干扰和音乐噪声,提高了源信号的分离质量。计算机仿真实验结果表明了上述方法的有效性。