抗噪声汉语单词识别方法的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:panxuanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的语音识别系统对干净语音可以达到非常高的识别精度,但是无处不在的噪声带来了训练模型和测试语音之间的失配,造成识别器的性能在噪声环境下急剧地下降。因此抗噪声问题是语音识别达到真正实用所必须解决的关键问题。本文针对谱减法中关于噪声是零均值的高斯分布的假设,提出了一种可以打破这一假设的改进谱减算法。语音增强实验结果表明,该改进谱减算法能有效地提高增强效果,更好地抑制音乐噪声,提高语音质量。并将改进谱减算法作为噪声下语音识别系统的前端处理过程,即通过对含噪的语音进行语音增强以提高信号的信噪比,从而提高语音识别系统的抗噪声性能。本文详细分析了噪声对相对自相关序列MFCC(RAS-MFCC)特征的影响,并研究了高阶RAS-MFCC系数的抗噪声性能。实验结果表明,去除1~3阶低阶系数的RAS-MFCC系数作为语音特征的抗噪声性能明显优于原始RAS-MFCC特征。本文提出了将RAS-MFCC特征和最小均方误差估计(MMSE)语音增强方法相结合的抗噪声语音识别方法。实验结果表明,这种相结合的方法能有效地提高语音识别系统的识别率,并且在低信噪比情况下仍能使系统保持相当高的识别率。
其他文献
多用户检测是未来移动通信系统的关键技术之一。论文围绕多用户检测优化算法,主要做了以下工作: 第一,提出采用优化时变步长因子改进LMS算法性能。在此基础上得到三个新算
作为一种信息获取和处理的全新技术,无线传感器网络在军事、医疗、环境、交通等领域得到了广泛的应用。尽管无线传感器网络的发展十分迅速,但有关其安全问题的研究仍处于起步
本课题中研究和实现了基于Cobranet技术的EtherAudio音频路由器,EtherAudio音频路由器的功能是利用廉价普及的以太网实时传输多路高质量音频信号。该设备可以通过一根普通5类
新兴多媒体应用领域的发展,要求新的视频压缩技术能在保证高质量的同时具有更低的码率。MPEG-4以其低码率、基于对象的交互性等优点近年来在多媒体领域表现出巨大的应用潜力
短波通信具有较高的抗摧毁能力和自主通信能力,且能通过电离层反射实现较远距离的通信。这一传统通信方式在现代通信中仍然得到广泛应用。由于短波波长较长,短波天线尺寸较大
综合业务终端是基于新型有线电视接入网向家庭用户提供综合业务的设备,通过一个网络,它可以让用户不但实现互联网接入、数字电视、IP电话等功能,同时还可享受视频点播、居家
微波在化学领域中的应用越来越广泛,近年来,大量实验已经证实,微波可以极大地提高一些化学反应速率,大大缩短化学反应时间,省溶剂、节约能源、减少废物的产生,同时可以提高提取物的
移动自组网(MANET:MobileAdHocNetwork)是一种新型的无线移动网络,它不依赖固定网络设施,是能快速展开、自治、多跳的网络结构。它由一组带有无线收发装置的节点组成,整个网络通
随着科技社会的飞速发展,数字图像处理在计算机科学、电子技术、生物医疗、自动化、卫星定位等方面得到了广泛的应用。其中数字图像处理主要可以分为三个层次:狭义图像处理、
在市场越来越细分和技术日益更新的情况下,宽带市场要想赢得用户就必须提供更加灵活、细分并且是打包、捆绑销售的业务。以IPTV为代表的Triple Play(三重播放)业务是网络融合