论文部分内容阅读
本文基于16位定点DSP TMS320C5402 实施了一种频域谱相减算法,频域谱相减法的基础是单麦克输入,算法用于以说话人识别为核心的语音门锁的预处理部分。语音预处理是一个语音信号处理的基础研究。在语音通信系统中,加性宽带背景噪声严重损伤了语音质量和可懂度,而且宽带噪声与语音信号在时域和频域上完全重叠,滤除宽带噪声的难度较大。目前,由于数字信号处理器的兴起,使得信号处理算法的实时实现成为可能,因此本文所作的研究有非常强烈的现实意义。首先,对背景噪声进行初始估计,噪声是频域的统计平均,统计是在每次识别或训练前进行的。谱相减过程,利用FFT变换将观测信号变换到频域,减去估计的噪声幅度谱,得到增强的频域信号。估计的噪声幅度谱是受基于短时能量的话音激活检测来控制的。当观测信号的幅度谱的能量小于估计的域值时,对噪声谱作出更新。当观测信号的幅度谱大于估计的域值时,对此帧信号进行谱相减。谱相减采用全波整流的方式进行。对于增强后的频域信号,再进行IFFT变换,即可得到时域信号。对增强后的信号,求取线性预测系数,作为说话人识别的特征矢量。本文主要分七个部分来论述。本文第一章,简要回顾了语音信号处理的历史,介绍了语音信号处理的学科分类,提出了本文所要研究的任务相关知识及章节安排。第二章,研究了语音特性,特别是频率特性,这对于整个语音信号处理是较为关键的;其次,对于语音信号的采集、语音预加重,语音的平滑做了研究,并对部分环节做了仿真;第三,研究了语音的线性预测。第三章,经过对语音降噪算法的研究,提出了切合实际的算法,基于频域的幅度谱相减法。语音降噪算法的前提是观测信号中的噪声为加性高斯白噪声。首先,对背景噪声进行估计,噪声是统计平均的频域。首先利用FFT<WP=87>变换将观测信号变换到频域,减去估计的噪声谱,得到增强以后的频域信号。再对频域信号作IFFT变换,即可得到时域信号。在谱相减时,要对信号和噪声作出合理的区分,这是本算法的难点,也是需要改进之处。在最后,对于仿真结果进行了说明。第四章,在说话人识别系统要求下,提出语音预处理算法的硬件平台。硬件主要是以TMS320C5402为核心,通过编码解码芯片AD50与DSP串行通信。DSP采用DMA通信方式。本章说明DSP与AD50的通信控制及配置方法。第五章,对于谱相减算法进行实施。本章主要介绍了实现RFFT的方法。实现FIR滤波的方法,介绍了循环缓冲的实现过程。本章的算法是本文的核心。本章也是对DSP软件库函数应用的小结。第六章,在前文充分论证的基础上,实施了谱相减算法和Durbin算法。给出了部分实验结果。第七章,总结了全文。总结了本文主要工作,探讨了以及后续工作需要改进之处。总之,本文是语音信号处理的基础工作,是实时信号处理的一个探索,是后继者可以参考的资料。