鲁棒性语音识别中的一种特征参数规整的优化算法

来源 :第八届全国人机语音通讯学术会议(NCMMSC8) | 被引量 : 0次 | 上传用户:ll730520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高语音识别系统的鲁棒性,本文提出了一种特征参数规整的优化算法.整个算法由环境选择、MFCC差分扩展、均值方差规整(MeanandVarianceNormalization,MVN)和ARMA滤波器平滑四个模块组成.首先我们对扩展和平滑这两个模块进行了一系列的优化,然后再加入环境选择的思想进一步提高了性能.在Aurora2数据库上总识别率的相对提升达到了53.23%,要明显优于传统的各种参数规整方法,并且和ETSIAFE标准前端的性能基本持平.
其他文献
作为Blog家族的新成员,2004年10月在互联网上爆发性流行的发布音频文件的新技术Podcasting给传统传媒带来了巨大的冲击。尽管雅虎的RSS白皮书调查发现,只有28%的互联网用户知
产业环境趋冷时,三一恰站在通往1000亿的门槛上,它需要通过组织架构调整和国际化来冲过这一关唐修国的一条腿受伤了,打了绷带走路的时候需要借助双拐。不过“休息”对他来说
本文提出了可应用于资源受限系统的汉语声学模型.应用该模型,可以大大降低存储空间,在保证识别率基本不变的前提下,减少了识别时间.在550个命令词组成的词表的实验室环境的识
期刊
租房宝本质上做的是房屋租赁的“按揭”业务,用户在此平台上用信用卡便捷地支付房租,然后再分期还款。租房宝还可以向房东谈判,适当降低房租,帮助租户节约租金。租房宝已经与支付
在噪声鲁棒语音识别研究中,并行模型结合方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。本文提出了利用
本文研究了广播电视环境下的说话人跟踪检测技术.论文的主要工作集中在两个方面:音频数据的切分和目标人检测.提出了基于熵的音频跳变点检测方法,切分后的语音片断通过说话人
会议
本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充
会议
1969年“定位”理论由特劳特先生首次提出1972年美国权威营销传播类刊物《广告时代》刊登了特劳特和阿尔·里斯的系列文童《定位时代来临》,定位观念从此进入人们的视野;1981年
“干经济”是近现代以来持续了数百年的经济发展模式,其核心是以工业理性、经济理性来完成埘经济资源的分配。也正因为如此,人类这几百年来强调的是理性、效率,人本身只等于一个