基于深度学习的汉语语音关键词检测方法研究

被引量 : 0次 | 上传用户:dongjuanqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音关键词检测是一种从连续的语音流中检测预定义的一组关键词的技术,它的一种主流方法是基于大词汇量连续语音识别器(Large Vocabulary Continuous Speech Recognition,LVCSR)的。基于语音识别器的关键词检测系统主要有两个阶段——解码阶段和检测阶段,语音识别器的性能对关键词检测的性能有很大影响。传统的关键词检测是用GMM(Gaussian Mixture Model)和HMM(Hidden Markov Model)结合的GMM-HMM模型作为LVCSR的声学模型,其识别率不高。近年来深度学习技术对语音识别产生了巨大影响,人们对DNN(Deep Neural Network)替代GMM组成DNN-HMM声学模型进行了深入研究。本文研究在关键词检测中用DNN-HMM声学模型替代GMM-HMM声学模型,并在DNN-HMM声学模型的基础上建立关键词检测系统。实验结果表明,基于DNN-HMM模型的语音识别器相比基于GMM-HMM模型的语音识别器识别率更高,关键词检测系统的性能也更好。针对基于LVCSR的关键词检测两阶段间缺乏紧密联系的问题,本文在DNN-HMM声学模型的基础上,研究了在声学模型的训练阶段,对关键词赋予较大的权重以提高模型对关键词的建模能力。因此,本文考虑在区分性训练中,利用侧重关键词的非均匀准则进行训练。本文首先研究了对关键词进行侧重的非均匀MCE(Minimum Classification Erro)准则,然后用非均匀MCE准则对声学模型参数进行优化。非均匀MCE准则中关键词的权重系数对识别结果有一定影响,固定权重系数的缺点是较大的权重系数可能导致过训练。因此本文研究利用Ada Boost(Adaptive Boosting)算法来动态调整非均匀MCE训练过程中的权重系数,Ada Boost算法可以避免非均匀MCE准则中的过训练问题,提高模型的泛化能力。实验结果表明,基于Ada Boost算法的非均匀MCE准则的关键词检测性能更好。此外,本文还研究了非均匀s MBR(statelevel Minimum Bayes Risk)准则,实验结果表明,基于非均匀s MBR方法的系统性能要好于基线系统,本文最后对这两种非均匀准则进行了总结和对比。
其他文献
城市群系统既包括原有的自然生态系统,也包括经过人工变革后的社会经济系统(城镇建设空间),城市群系统与自然生态系统类似,也存在着形成、发展、生长、演替的过程,集群现象是
目的:通过对比分析尼泊尔和中国卫生资源,寻找共性与特点、成就与经验,为尼泊尔的卫生事业发展提供相应的对策和建议。方法:通过数据收集、文献阅读等途径了解尼泊尔卫生状况
该文介绍杭州师范大学附属医院与拱墅区社区服务中心联合干预防治妊娠糖尿病主要做法和实施成效,探索早期联合管理妊娠糖尿病的模式。以期利用社区和综合医院现有资源,从孕早
获得及时且有效的康复训练已成为偏瘫或者截瘫病人的迫切需求,然而康复医师匮乏、康复设备落后却是患者康复的主要障碍。因此,如何设计一款可以替代康复医师对患者进行康复训
在企业关键业务部署、商务流程以及电子商务当中,集群服务具有重要作用。在广电行业中,其在电视节目制作当中因在可靠性、安全性以及数据完整性方面的要求,对服务器集群技术
面对资源紧缺和环境污染两大问题,世界各国都大力发展和推广新能源电动车。电机驱动系统是电动车发展的关键技术之一,开关磁阻电机(SRM)因起动转矩大、调速范围宽、驱动效率
文章阐述了多机型的发动机共装配共线的生产应用,首先描述了什么是发动机装配,发动机装配时要点重点,为什么要实现发动机装配共线生产,共线能带来什么样的优点,其次描述装配
煤炭企业关键岗位员工承担着企业的重要职责,对企业战略目标的实现有着重要影响。近年来我国煤炭市场持续低迷,煤炭企业的生存和发展面临严峻的挑战,煤炭企业针对关键岗位实
今天的人类已经与设计如此紧密地融为一体,简直无法想象没有设计的世界将会如何,设计就是设计生活,反映社会,反映生活,设计改变社会,设计创造未来,
会议
<正>~~