论文部分内容阅读
信号的稀疏性是压缩感知理论的应用前提,压缩感知用最少的观测数来对信号进行压缩采样,实现了信号的降维处理,节约了采样和传输的成本,给信号采样技术带来一场新的革命。对于语音信号而言,由于其具有近似稀疏性,可以将压缩感知理论与语音信号处理技术结合,打破了传统的建立于奈奎斯特采样的语音信号处理经典模式。用压缩感知理论中的观测序列来代替传统奈奎斯特语音采样值,将导致信号特征发生根本性的变化,从而影响语音信号处理应用的各个领域。本课题在对压缩感知理论深入研究的基础上,研究了语音信号的压缩感知稀疏域和基于观测序列的语音端点检测算法,提出一种适合语音的观测矩阵,并对该观测矩阵投影下的观测序列模型进行研究,针对语音压缩感知,提出一种码本映射联合l1重构算法。论文的主要工作和创新如下:(1)研究语音观测序列在不同稀疏域下的压缩感知重构技术,对比语音信号在DCT、DFT、DWT及K-L变换下的稀疏性。研究表明,虽然在K-L变换下语音系数是最稀疏的,但由于重构时需要用到原信号的自相关矩阵,实际应用困难,而在前三种稀疏域下,DCT变换的稀疏性最好。研究了在随机高斯矩阵投影下,压缩感知BP重构和OMP重构的原理及性能。实验结果显示对语音信号而言,在相同观测点数下,BP重构性能优于OMP,但运算复杂度大。研究了语音观测在过完备余弦字典及KSVD字典下的压缩感知,由于系数稀疏性的增强,其重构效果比DCT基均有提高,且KSVD字典重构性能优于过完备余弦字典。根据语音帧和非语音帧压缩感知观测序列频谱幅度分布分散且差异较大的特性,提出一种基于压缩感知观测序列倒谱距离的语音端点检测算法,以直接根据观测序列特性分析判断出原始输入语音的属性。对不同信噪比下的带噪语音进行端点检测仿真实验,其性能与传统奈奎斯特采样下的倒谱端点检测相当,但可以降低运算量。(2)针对DCT稀疏基下,语音信号采用随机高斯观测矩阵投影时,压缩感知重构零(近似零)系数定位能力差,导致对重构质量起主导作用的系数样值发生较大误差的问题,提出一种适合于语音信号压缩采样的行阶梯观测矩阵,并对压缩观测序列采用对偶仿射尺度内点算法进行重构。仿真实验结果显示,行阶梯矩阵做观测矩阵,能够对语音信号的零(近似零)系数进行较好的定位,从而得到明显优于高斯观测矩阵下语音压缩感知的重构性能,并且行阶梯观测矩阵与随机高斯观测矩阵相比,相应的数据量和运算量都大大减小。因此,作者认为,行阶梯观测矩阵是适合语音信号压缩感知采样的比较理想的投影矩阵。(3)鉴于行阶梯矩阵投影下得到的语音压缩观测序列仍具有较强的相关性,提出对观测序列采用Volterra级数二次建模,分析输入序列维数和模型阶数对语音行阶梯观测序列预测的效果,并联合使用Wiener滤波器以提高预测准确程度,实现了基于部分CS观测序列、Volterra模型、Wiener滤波器的CS重构。(4)论文最后针对CS重构算法计算量大的问题,提出一种基于观测序列与原始序列关系的码本映射重构方法,该方法与l1重构相比,对稀疏系数的位置估计较为准确,且不需要优化算法进行重构,而是从训练得到的码本中直接得到重构系数,重构时需要的计算量比BP和OMP算法明显下降。但由于系数大小估计不够准确,综合考虑重构性能和运算量,采用码本映射联合l1重构。该算法训练阶段得到语音码本和观测码本,测试阶段先估计测试语音的SNR,然后根据SNR和CS压缩比选择相应的能量门限,观测序列帧能量大于采用l1重构,小于l1采用码本重构。实验表明,在中低SNR环境下,码本映射联合l1重构算法在一定的能量门限下重构性能优于l1重构,在高SNR和无噪环境下,码本映射联合l1算法在码本帧数为总帧数3/10左右时,可获得与l1重构相当的性能。联合算法中码本重构部分由于不需要计算量很大的非线性优化算法,能够节省相应的运算量。