论文部分内容阅读
在现实生活中,语音在通信过程中不可避免地会受到周边环境的影响。通信中的机械声、交通鸣笛和他人话音等背景噪声严重影响语音信号的可懂度和清晰度,降低了语音信号的质量。人们需要利用语音增强技术从这些被―污染‖的含噪语音信号中提取出尽可能纯净的语音信号。目前传统的数字信号处理方法中,我们根据通道麦克风的数量,将语音增强算法分为单通道语音增强方法和麦克风阵列语音增强方法。本文提出的增强方法都是基于单通道的语音增强方法。近些年,基于稀疏表示和字典学习的语音增强算法被广泛地研究和应用在语音增强和语音分离领域。基于联合字典学习的单通道语音增强方法利用语音和噪声的特性进行增强,但是对干扰噪声的处理具有局限性。本文针对联合字典的“交叉投影”问题,利用新的优化函数的约束性构造区分性联合字典,并提出了基于联合约束双层字典的单通道语音增强方法。其中主要的研究内容和创新点包含:(1)简要概述了单通道语音增强技术的背景、意义和国内外发展现状,详细阐述了稀疏表示和字典学习的基本原理,以及基于字典学习的单通道语音增强算法。我们在使用基于联合字典学习的单通道语音增强方法时,发现此方法仅考虑语音和噪声的特性,信号在联合字典的子字典之间容易产生“交叉投影”现象,从而造成源混淆,影响含噪语音的增强效果。(2)为了解决联合字典的“交叉投影”现象,提出了一种新的优化函数,并基于此函数实现了基于联合字典学习的单通道语音增强新方法。该方法利用优化函数约束含噪信号在联合字典上的稀疏表示,控制其语音信号和噪声信号在对应子字典上投影时的近似误差,最小化交叉投影误差,并利用合适的调节因子平衡约束项的权重,使得训练的联合字典更加具有区分性。因此当基于联合字典学习的方法语音增强时,含噪信号的语音成分能够更多地投影到联合字典中的语音子字典上,而不被噪声子字典影响,从而使得增强后语音的质量和可懂度更高,达到语音增强的效果。(3)为了进一步抑制联合字典的易混淆部分,提出了基于联合约束双层字典学习的单通道语音增强方法。在训练阶段首先采用干净语音和噪声训练初始化特征子字典,然后基于区分性约束和抗混淆约束的优化函数训练双层联合字典,第一层字典表达语音信号和噪声的可区分分量,而第二层字典表达语音信号和噪声的易混淆成分。在测试阶段含噪语音在双层联合字典上投影得到稀疏系数矩阵,然后重构得到增强后的语音。该方法利用目标优化函数的约束性减少―交叉投影‖现象的发生,降低了信号在联合字典的混淆,从而进一步提升了语音增强的效果。