噪音环境下的语音识别方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ccssddnn_ccssddnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术在安静的环境中已经达到令人鼓舞的准确率,但在现实环境中由于各种不同噪声的引入使得语音识别的性能显著下降,因而在强噪声环境下的语音识别技术的研究有重要意义。语音识别系统主要包括预处理、特征提取、参考模式、模式匹配四大部分。本文的重点是在预处理阶段,对语音进行语音增强。本文主要分析了小波理论应用到语音增强的相关理论。结合折中阈值函数、μ律阈值函数的特点,本文提出了一种小波阈值改进函数,实验结果表明语音增强效果有很大改善。接下来本文提出了基于卡尔曼滤波小波变换改进算法,对比基于卡尔曼滤波小波变换算法有相比,从整体降噪效果看有很大改进;同时本文将基于听觉掩蔽特性的小波变换理论应用到语音增强上。以上两种方法都有效的去除了噪音,但是从听觉效果和波形图中,可以发现仍然还存在一部分冗余噪音。通过双门限端点检测法对增强后语音进行检测,实验结果表明经小波阈值改进方法降噪后语音可以相对准确地检测出每个字发音的起始和结束点。在提取语音信号特征参数部分,本文选有美尔频率倒谱系数(MFCC);最后利用动态时间规整算法计算模式识别结果,在不同信噪比下,经过小波阈值改进方法增强后的语音的匹配效果明显好转。
其他文献
原发性胃肠道恶性淋巴瘤发生率占消化道恶性肿瘤1%~4%[1],易误诊为消化系统其它疾病.我科近年来共收治原发性肠道恶性淋巴瘤11例,均经病理确诊,现总结分析如下.
2014年12月-2016年12月由州农牧部门指导、门源县农牧部门组织、苏吉滩乡兽医站技术人员负责实施的生态畜牧业能力提升项目(也叫两年三胎项目)告一段落,效果如何,农牧民群众的
目前上海市畜牧业正处于转型升级的关键期;畜禽养殖业的结构和模式发生较大变化;为了解基层防疫队伍现状,科学指导基层队伍防疫工作;本文通过问卷调查、座谈走访、实地调研等
眩晕系指人体对自身和空间位置关系的错觉[1],临床常见的病因有椎-基底动脉供血不足,颈椎病及美尼尔氏病等.椎基底动脉缺血性眩晕十分常见,我科于1996年至2002年采用高压氧配
根据机械力化学概念,从分析水泥颗粒的合理组成、混合粉磨中选择性磨细、超细粉磨等几方面,对水泥基材料在粉磨过程中呈现的机械力化学效应进行了综述.并对机械力化学效应在
近年来,蚌埠市大力实施工业强市战略,依托玻璃产业龙头企业,发挥资源丰富优势,加快自主创新和装备进步,积极引进战略合作伙伴,推进产业结构调整,玻璃产业集聚初步形成,成为安
电力建设发展很快,有力地促进了国民经济的发展,同时,由于种种的原因,电力工程造价上涨很快,影响了电力建设的健康发展。本文首先电网建设工程造价管理的特点,结合工作实践阐述了城
子宫穿孔是计划生育手术较为严重的并发症,最常见于人工流产、放环、取环、引产后清宫等宫腔内操作不当所致,有时可发生失血、感染、脏器损伤等严重后果,若不及时诊治可危及
介绍了云南省水泥行业磨机使用铬合金铸球及其发展的情况,阐明其耐磨性能及其基体组织的特点,并对云南水泥行业应用铬合金铸球提出了建议.