论文部分内容阅读
单通道混合语音分离是语音分离研究的重要方向,稀疏分解理论的发展为解决单通道混合语音分离问题提供了新的思路。正因为如此,本论文主要研究基于稀疏分解的单通道混合语音分离算法。借鉴稀疏分解和随之发展起来的压缩感知的理论成果,通过字典学习,构造合适的与源语音信号自适应的基或字典,在此基础上,采用l0 -范数优化算法,设计有效的基于稀疏分解的单通道混合语音分离算法和基于压缩感知的单通道混合语音分离算法,以达到增强目标语音,抑制干扰语音的目的。本论文的主要工作和创新如下:①从探讨如何构造与源语音信号自适应的基或字典出发,提出通过对角化源语音信号自相关矩阵,构造理想准KLT基,并从理论上证明,任何信号在理想准KLT基下都具有稀疏性。鉴于在实际情况下,不一定能获得确切的理想准KLT基,提出通过选取合适的模板和计算相应的模板匹配系数,来近似语音信号的自相关矩阵,再对近似的自相关矩阵进行特征值分解,构造两种实用的模板匹配准KLT基—非齐次线性均方估计模板匹配准KLT基和正交匹配追踪模板匹配准KLT基。仿真表明,浊音信号在模板匹配准KLT基下的特性与在理想准KLT基下的特性相近。②以创新点①为基础,研究基于准KLT基的单通道混合语音分离。a从理论上证明,当基函数满足一定的条件时,采用l0 -范数优化算法,可以实现单通道混合语音的完美分离,并进一步证明理想准KLT基满足该条件b由于实际语音分离时,源信号未知,故无法获得理想准KLT基,提出对上述两种模板匹配准KLT基构造方法进行改进,以混合语音信号为已知条件,来构造各源语音信号的模板匹配准KLT基。在此基础上,提出了两种实用的基于模板匹配准KLT基的单通道混合语音分离算法—基于非齐次线性均方估计模板匹配准KLT基的分离算法和基于正交匹配追踪模板匹配准KLT基的分离算法。仿真表明,该算法的性能优于现有的基于独立成分分析基的分离算法和采用形分析技术改进后的计算机场景分析算法。③论文将压缩感知和单通道混合语音分离相联系,研究基于压缩感知的单通道混合语音分离。a从压缩感知的视角看待单通道混合语音分离问题,设计基于压缩感知和K-SVD的单通道混合语音分离算法。仿真表明,该算法对各类混合语音的分离效果相差不大,性能稳定。b在DCT域设计基于能量特性的帧间帧内自适应语音压缩感知观测构造算法,以进一步减少基于压缩感知的源语音信号的“采样率”,为研究基于压缩感知观测特性的单通道混合语音分离奠定基础。仿真表明,该算法的性能优于贝叶斯压缩感知算法的性能。