说话人识别中的语音预处理算法研究与DSP实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:intaaab
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文基于16位定点DSP TMS320C5402 实施了一种频域谱相减算法,频域谱相减法的基础是单麦克输入,算法用于以说话人识别为核心的语音门锁的预处理部分。语音预处理是一个语音信号处理的基础研究。在语音通信系统中,加性宽带背景噪声严重损伤了语音质量和可懂度,而且宽带噪声与语音信号在时域和频域上完全重叠,滤除宽带噪声的难度较大。目前,由于数字信号处理器的兴起,使得信号处理算法的实时实现成为可能,因此本文所作的研究有非常强烈的现实意义。首先,对背景噪声进行初始估计,噪声是频域的统计平均,统计是在每次识别或训练前进行的。谱相减过程,利用FFT变换将观测信号变换到频域,减去估计的噪声幅度谱,得到增强的频域信号。估计的噪声幅度谱是受基于短时能量的话音激活检测来控制的。当观测信号的幅度谱的能量小于估计的域值时,对噪声谱作出更新。当观测信号的幅度谱大于估计的域值时,对此帧信号进行谱相减。谱相减采用全波整流的方式进行。对于增强后的频域信号,再进行IFFT变换,即可得到时域信号。对增强后的信号,求取线性预测系数,作为说话人识别的特征矢量。本文主要分七个部分来论述。本文第一章,简要回顾了语音信号处理的历史,介绍了语音信号处理的学科分类,提出了本文所要研究的任务相关知识及章节安排。第二章,研究了语音特性,特别是频率特性,这对于整个语音信号处理是较为关键的;其次,对于语音信号的采集、语音预加重,语音的平滑做了研究,并对部分环节做了仿真;第三,研究了语音的线性预测。第三章,经过对语音降噪算法的研究,提出了切合实际的算法,基于频域的幅度谱相减法。语音降噪算法的前提是观测信号中的噪声为加性高斯白噪声。首先,对背景噪声进行估计,噪声是统计平均的频域。首先利用FFT<WP=87>变换将观测信号变换到频域,减去估计的噪声谱,得到增强以后的频域信号。再对频域信号作IFFT变换,即可得到时域信号。在谱相减时,要对信号和噪声作出合理的区分,这是本算法的难点,也是需要改进之处。在最后,对于仿真结果进行了说明。第四章,在说话人识别系统要求下,提出语音预处理算法的硬件平台。硬件主要是以TMS320C5402为核心,通过编码解码芯片AD50与DSP串行通信。DSP采用DMA通信方式。本章说明DSP与AD50的通信控制及配置方法。第五章,对于谱相减算法进行实施。本章主要介绍了实现RFFT的方法。实现FIR滤波的方法,介绍了循环缓冲的实现过程。本章的算法是本文的核心。本章也是对DSP软件库函数应用的小结。第六章,在前文充分论证的基础上,实施了谱相减算法和Durbin算法。给出了部分实验结果。第七章,总结了全文。总结了本文主要工作,探讨了以及后续工作需要改进之处。总之,本文是语音信号处理的基础工作,是实时信号处理的一个探索,是后继者可以参考的资料。
其他文献
随着Internet技术的飞速发展,网络中的信息以不可思议的速度高速增长着。如何从海量的信息中准确快速地找出用户感兴趣的信息,是信息检索服务所要解决的问题。作为使用最多的网
人类基因组计划中的基因组测序已经完成,已绘制出了人类基因图谱框架图,人类将进入后基因组时代。RNA的结构和功能是当前生命科学研究的焦点问题,大量非编码小RNA的发现是开创这
水稻的倒伏问题一直是制约其产量的重要因素之一,而水稻茎秆相关性状与倒伏密切相关。不断发掘、利用水稻抗倒伏性状相关QTL,选育出抗倒伏品种,从而提高水稻收获指数,是新时期水稻理想株型和高产育种相结合的重要育种方向。本试验拟发掘和定位新的水稻茎秆相关QTL,并综合分析了茎宽、株高、节间长度、茎节壁厚与抗倒伏之间的相关联系,为抗倒伏QTL在育种上的应用提供理论依据和中间材料。本实验的主要研究结果如下:1
本文针对传统耕作方式引起的土壤侵蚀加剧、土壤有机质含量下降、土壤结构的稳定性降低以及水资源浪费严重等问题,研究了春小麦留茬覆盖免耕的防沙尘效应以及翌年免耕春玉米田的土壤水分特征、土壤微生物量C、N、P含量和土壤的部分物理性状,主要研究结果有:1.留茬覆盖免耕保护性耕作的防风蚀效应留茬高度高和立秆留茬能够显著提高风蚀临界风速。高留茬(40cm)可显著提高地表的风蚀临界风速,其防风蚀效果好于低留茬(2