抗噪语音识别系统研究与实现

来源 :成都理工大学 | 被引量 : 10次 | 上传用户:tu309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噪声的存在是语音识别技术广泛实用化的最大障碍。在实际的语音识别应用过程中,获取和传输过程中的原始语音不可避免地受到来自周围环境和传输介质的噪声的干扰。这些干扰会使语音质量下降,从而造成语音识别系统的性能大幅度下降。因此,消除含噪语音信号的噪声,增强语音的清晰度,是语音识别技术进入广泛实用化的关键。在语音去噪方面,经过多年的不断研究,人们提出了各种各样的语音去噪的算法,如谱相减法和维纳滤波法等。小波变换是80年代后期迅速发展起来的一种新型的数学分析工具,它具有多分辨率分析的特点,在时域、频域同时具有良好的局部化性质。通过伸缩、平移等运算功能对信号进行多尺度细化分析,小波分析能有效地从信号中提取出有用信息。由于小波变换在分析非平稳信号方面的优势,近年来它被广泛的应用于语音去噪领域。小波去噪的主要方法有三大类:模极大值去噪法、相关去噪法以及阈值去噪法。其中基于小波阈值的去噪方法,由于计算简单且去噪效果明显而得到了广泛的应用。本文针对语音增强方法技术进行了广泛研究探讨,介绍并比较了现有的各种语音增强方法,主要分析了小波变换应用于语音去噪的相关理论,研究了基于小波阈值的语音增强方法。重点针对小波阈值去噪法中关于小波基、小波分解层数、阈值及阈值函数四个关键参数的合理选取问题,进行了系统深入的研究。阈值函数体现了对小波系数的不同处理策略,对小波去噪的效果有很大影响。目前,在实际中广泛使用的是硬阈值函数和软阈值函数。这两种方法先天都存在着不足,硬阈值函数是不连续的,这会导致去噪后的信号出现伪Gibbs现象,信号中仍然含有明显的噪声;采用软阈值方法虽然连续性好,但估计的小波系数与含噪信号的小波系数之间存在恒定的偏差。由此,本文针对小波阈值去噪法中软、硬阈值函数的不足,提出了一种新的阈值函数,不仅克服了硬阈值函数不连续的缺点,而且解决了软阈值函数存在恒定偏差的问题。通过实验仿真证明,使用本文改进后的阈值函数进行语音去噪,能有效去除语音信号中含有的白噪声,在信噪比指标上明显优于传统的阈值函数方法,可获得更好的去噪效果,与传统的阈值函数法相比具有明显优越性和有效性。通过基于对小波阈值去噪法的大量研究,设计并实现了一个抗噪性能较好的语音指令控制系统。论文从语音信号的预处理、小波语音增强、端点检测、语音特征提取、HMM训练以及识别等几个方面详细的分析了语音识别系统的设计过程。
其他文献
为了使Web上的信息具有计算机可以理解的语义,语义网对现有的Web进行了扩展;而本体描述了其中的语义,是支持语义网实际运行的知识库,本体具体表现为领域内共同认可的概念及概
计算机软件技术、网络通信技术和微电子技术的发展,医院管理信息化、网络化的需求,推动着医学图像数字化的快速发展。医学图像数据库是建立在图像数据库、图像处理、计算机网
多协议标签交换(MPLS, Multi-protocol Label Switching)技术因具备快速转发、高质量服务、多业务支持等优势,在当前的网络中发挥越来越重要的作用。在运营商、银行、政企网
近年来,随着图像数据的爆炸式增长,图像分类在很多领域都已成为一项关键性工作,因此对图像分类方法进行研究具有十分重要的价值和意义。本文围绕图像特征的有效提取和适应于
以网络技术为主导数字语言教学系统是高校外语教学的必然趋势。研究在大学外语教学中如何全面发挥多媒体网络技术的作用,探究如何合理运用多媒体网络技术为大学外语教学改革服
传统的人工免疫系统大多建立在self─nonself识别基础上,然而self─nonself存在着天生的缺陷,例如自体集合过大,自体和非自体难以区分等。近年来兴起的危险理论很好的弥补了
图像分析与图像理解都是以数学分析为基础,利用计算机处理图像,完成某些任务,只是前者侧重于对图像中感兴趣区域的分割、检测等操作;而后者侧重于获取图像中的知识,对图像进行
作为一种主动的网络安全技术,入侵检测不仅能够发现外部入侵者的攻击,而且也能检测到内部合法用户的非授权操作,被誉为继防火墙之后的第二道网络安全闸门。目前,许多学者将支
石油勘探领域与计算机相关技术的有机结合,实现了录井导向的二维可视化,提高了石油勘探的质量和效率。随着石油勘探过程中对录井导向技术精确性和形象性要求的不断提高,以目
随着世界城市化进程的发展及人们生活水平的提高,各大城市中公交问题尤其显著,而目前我国大部分城市采用的是传统的手工调度方式,无法满足乘客出行的需要,因此建立先进、智能