论文部分内容阅读
基音周期与频谱包络表征了语音信号的声学特性。基音周期体现了发声过程肺部气流的周期性,而语音频谱包络是人的声道共振滤波特性在频域中的表现。语音频谱包络携带了语音信号的语义和个性化信息,准确提取频谱包络是语音分析的一项重要任务。本文主要对语音频谱包络的提取方法进行研究。论文首先研究了传统语音频谱包络提取方法:时域提取方法、频域提取方法,并讨论了不同的提取方法以及噪声对提取结果的影响。接着,针对传统提取方法存在的共振峰合并以及容易产生虚假谱峰的问题,提出了一种可提取语音频谱包络的分段线性预测算法(PLPC,Piecewise Linear Predictive Coding)。PLPC算法通过设计一组滤波器对语音频谱进行划分,然后对位于不同频段的分量信号用LPC方法提取语音频谱包络。PLPC算法中设计了多通道的非均匀滤波器组来匹配人耳听觉的频率分辨特性;提取不同频段分量信号的频谱包络时,PLPC算法对传统LPC方法进行了改进。由于滤波器组对噪声频谱也同时进行了划分,PLPC算法的抗噪声性能有了较好的改善。实验表明,PLPC算法比传统方法能得到更准确的提取结果。除了提取语音频谱包络,PLPC算法还可用于估计共振峰频率以及检测基音周期。最后,以TMS320C5509A为硬件基础,研究了PLPC算法的实现、程序代码的定点化,并分析了算法的复杂度和存储空间需求。基于PLPC算法提取语音频谱包络能有效解决共振峰合并以及容易产生虚假谱峰的问题,并且计算复杂度低,对于语音信号分析具有一定实用价值。