论文部分内容阅读
语音是人类最便捷和自然的交流工具之 ,一方面它消除了人与人之间交流的距离隔阂,另一方面它也提高了人与机器之间交互的效率。然而,现实环境中无处不在的噪声也不同程度地影响着语音交流的质量,研究有效的语音降噪技术就显得尤为重要,也是近几十年来学者们研究的热点。语音降噪是指在不显著丢失语音成分的前提下尽可能地削弱噪声,以实现提高语音的质量和可懂度这两个目标。而现实环境中的非平稳噪声及与人类语音类似的噪声则极大地提高了语音降噪的难度,传统的语音降噪算法此时往往不再适用。近年来,随着字典学习和稀疏表示理论研究的不断深入,给语音降噪问题提供了一种有效的解决途径。分别提取最能表征干净语音和噪声的特征并构造成字典,从而通过带噪语音在字典上的稀疏表示恢复出干净语音。不同于现有的基于字典学习和稀疏表示的语音降噪算法,本文针对有监督和半监督两种情况下的单通道语音降噪任务,进一步地挖掘信号之间存在的区别与联系信息对于字典学习和稀疏表示所起的作用。以这些信号间的关系作为主线,下面介绍本论文的主要工作和创新点。首先,提出了Fisher准则约束下基于区分性联合字典学习的有监督语音降噪算法。在字典学习阶段强调干净语音与噪声之间的区别关系,一方面添加字典区分性保真项,使语音字典和噪声字典之间的相关性最小;另一方面根据稀疏表示系数分布的差异性添加Fisher约束项,使干净语音和噪声各自的稀疏表示系数类内距离更小,类间距离更大,增大了稀疏表示系数的区分性。其次,提出了基于互补联合字典学习和稀疏表示的有监督语音降噪算法。在字典学习阶段强调带噪语音与干净语音、带噪语音和噪声之间的联系关系,用以约束联合字典的学习,使得字典原子级上映射关系的线性组合能表征信号间的联系关系,缓解源混淆和源失真问题。在降噪阶段中强调干净语音和噪声在稀疏表示效果上的互补关系,考虑信号结构特性与输入信噪比因素设置了两路稀疏表示的权重系数。最后,提出了基于区分性稀疏约束下非负矩阵分解的半监督语音降噪算法。在降噪阶段利用带噪语音学习噪声字典的过程中强调了噪声与干净语音的区别关系,添加噪声字典与已知语音字典的区分性约束项,并给出了相应的字典与稀疏表示系数更新方法。