语音识别中的抗噪声技术

被引量 : 0次 | 上传用户:lxp3754
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的语音识别系统对纯净语音可以达到非常高的识别精度,但是无处不在噪声带来了训练模型和测试语音之间的失配,识别器的性能在噪声环境中将会急剧下降。因此抗噪声问题是语音识别达到真正实用所必须解决的关键问题。加性背景噪声对语音识别影响非常大。论文工作的贡献之一是提出了一种基于语音增强失真补偿的算法,通过对多种抗噪声算法的有效融合来提高系统在背景噪声中的稳健性。在信号空间,利用语音增强有效抑制噪声,提高输入信号中的鉴别信息,但增强带来的语音失真和增强后的剩余噪声是对语音识别非常不利的因素。分析表明,语音失真和剩余噪声可近似看作乘性噪声和加性噪声,因此可在模型空间利用并行模型合并(PMC)算法通过调整模型参数对剩余噪声进行补偿,或者在特征空间利用倒谱均值归一化(CMN)算法对语音失真和剩余噪声同时进行补偿。从另一角度看,PMC和CMN算法在中等信噪比条件下最为有效,因此语音增强在前端的消噪过程将促进PMC和CMN算法对系统稳健性的提高。对多空间算法的有效融合能显著提高系统在噪声环境,特别是低信噪比情况下的识别精度。随着无线通信和计算机通信的迅速发展,对冲激噪声下稳健语音识别技术的研究成为一个新的热点。通过对Viterbi译码过程的分析,得出冲激噪声对语音识别的影响在于其引入了不可靠的概率差距。针对该结论,论文提出了在高斯分量级对噪声敏感特征子向量的观测概率进行限值,从而直接消除冲激噪声对语音识别的影响。特征划分和门限取值是该算法的两个关键问题。论文提出了衡量各维特征噪声敏感度的方法,并根据分析结果对特征向量作合理的划分。针对敏感特征的门限取值,论文提出了一种近似算法,将多维高斯分布的积分转换为级数求和,而且计算得到的门限和最佳门限值非常接近。合理的特征划分和最佳门限的指定将使得在有效消除概率差距的同时,保留更多的识别信息。该算法能够显著提高系统在冲激噪声环境中的识别率,并保持对纯净语音的高识别率。计算量小以及对噪声特性依赖性低则是该算法在实际应用中的优点。
其他文献
介绍了β-环糊精包埋技术及其研究进展。对常用的包埋方法以及包埋物的表征方法进行了总结,并简单论述了各种方法的原理。
研制了一种新型的常温除油剂及常温除油新工艺 ,使用该新工艺除油可以达到高效、节能、防锈、无污染的目的
以丙烯酰胺(AM)、2-丙烯酰胺基-2-甲基丙磺酸(AMPS)或马来酸酐(MA)为单体,分别用过硫酸钾(PPS)和N,N’-亚甲基双丙烯酰胺(NMBA)做引发剂和交联剂,在水溶液中合成了两种二元共聚
本文紧紧围绕保险公司机动车辆保险费率厘定这一主题,从大数定律在保险业中的应用出发,研究了机动车辆保险费率厘定的实效原理、理论原理和一般方法,分析了保险市场的运行机制,以
根据严歌苓小说改编的电影《金陵十三钗》之所以受到诸多关注,除了因为张艺谋擅长的声色华美的电影语言外,影片贯穿始终的矛盾叙事手法是该片成功的另外一个重要原因。该片的
乳腺叶状肿瘤是一类少见的纤维上皮性肿瘤,临床表现多为单侧单发的无痛性肿块,一般活动度好,不侵犯胸肌和皮肤,溃疡及乳头回缩少见。叶状肿瘤根据其组织学特点分为:良性、交界性和
到2020年,我国要实现工业化、完成GDP翻两翻的奋斗目标。为此,我国能源工业必须要在短短十几年里完成翻一翻的战略任务,才能为之提供强有力的保障。处于工业化阶段的中国经济,已
目的:探讨和分析新型抗肿瘤药物不良反应现状方法:本文随机选取温州医科大学第一附属医院2011年7月到2013年10月进行化疗的肿瘤患者病例500例,其中男250例,女250例,年龄范围为1
油茶叶肿病是由细丽外担菌引起的油茶花叶病害,但其形成的瘿体茶泡和茶片可以食用。测定茶泡和茶片的营养成分,结果表明,成熟茶泡所含的水分、灰分、可溶性固形物、可溶性糖、蛋
外科病人在液体治疗过程中易发生液体过负荷,影响机体心、肺、肾等各组织器官功能,从而影响病人预后。因此,及时识别并处理液体过负荷显得尤为重要。而在此基础上如能避免液