【摘 要】
:
语音识别是人工智能领域一项关键性技术,是机器理解人类语言的重要手段。随着深度学习技术的出现,研究者们将更多的关注点投入到基于深度学习的语音识别模型中,多种语音识别模型接连不断地出现,语音识别的表现得到了进一步的提升。端到端语音识别框架的引入,将传统的声学模型和语言模型整合在一起,使得构建语音识别模型的流程变得更加容易。然而,虽然已有一些端到端的模型架构被成功应用到ASR系统中,但是其在特征信息利用
论文部分内容阅读
语音识别是人工智能领域一项关键性技术,是机器理解人类语言的重要手段。随着深度学习技术的出现,研究者们将更多的关注点投入到基于深度学习的语音识别模型中,多种语音识别模型接连不断地出现,语音识别的表现得到了进一步的提升。端到端语音识别框架的引入,将传统的声学模型和语言模型整合在一起,使得构建语音识别模型的流程变得更加容易。然而,虽然已有一些端到端的模型架构被成功应用到ASR系统中,但是其在特征信息利用、流式识别需求、建模单元选择等方面还有很多问题亟待解决。针对上述问题,本文将流式识别的方法融合到端到端的语音识别框架中,在保证模型识别率的前提下实现流式识别,并在此基础上,探究建模单元、网络结构以及模型参数的设置对模型的影响。综上,本文的主要工作和创新点主要包括:(1)分析了从传统的语音识别方法到现代语音识别方法的发展逻辑,以及语音识别多个领域中的应用场景。然后就目前语音识别技术中存在的困难和亟待解决的问题,以及中文语音识别经典的语料库展开说明。(2)研究了语音识别中的相关技术,包括语音特征提取技术、声学建模技术、语言建模技术,完成了基于MFCC和Fbank的特征提取,并基于自建的数据库完成了基于HMM-GMM的关键词识别模型。(3)将端到端的技术应用到语音识别的模型中,以中文字符作为建模单元,分别研究了基于CTC和基于Transformer的两种语音识别模型。在实验过程中,对CTC的建模采用了3种网络架构,探究网络架构对模型识别的影响;探究LSTM和GRU两种循环神经网络变体在数据集上的表现,总结两种网络的最佳应用场景。实验结果表明:层数较多的GRU网络适合较小数据集,而多层LSTM网络在较大数据集上有更好的模型表现;Transformer模型在较小的数据集上训练时间较长,相较而言收敛较为困难;而在较大的数据集上表现更优异。(4)为了更好的利用语音的特征,提出了将擅长提取局部特征的卷积网络与善于捕捉全局信息的Attention机制相结合,用以作为语音编码器的设计。为了解决端到端语音识别系统的延迟性,研究了RNN-T的解码器设计,在此基础上将其与基于注意力的解码器联合解码,并融入触发机制,提出具有流式语音识别特点的端到端模型。考虑注意力机制的种类以及触发注意力中的前瞻帧个数等超参数对于模型表现的影响,并对三种常见的中文语音识别建模单位展开讨论。结果表明,在thchs-30和aishell-1两个数据集中采用音节+字音的建模方式,并使用基于位置的注意力机制,能够在RNN-T和触发注意力的联合解码网络中实现流式识别,且保证模型识别准确率。
其他文献
本文提出了一种可用于高功率微波的宽带天线。该天线由平行平板TEM模式进行馈电,通过连续横向枝节(Continuous Transverse Stub,CTS)缝隙进行辐射。天线工作在行波状态,枝节边缘处进行倒角处理,避免了电场集中,当工作在高真空状态时,该天线的功率容量超过5 GW。仿真设计了一个工作在X、Ku双频段的天线阵列,天线的尺寸为1660 mm×440 mm×22 mm。结果表明:在10
随着我国市场经济的不断发展,我国大部分国有企业实现了现代企业制度的深化与改革发展。作为现代企业经营管理中的一种重要方法和有效的管理工具,制订完善的企业经营计划对促进国有企业的发展起了极为重要的作用。我国越来越多的国有企业通过经营计划的应用来实现对企业的管理。文章对经营计划的相关理论知识进行探讨,并积极探寻我国国有企业经营计划实施的新模式;通过对国有企业经营计划实施的探索与分析,对国有企业经营计划的
游戏法能被应用于小学体育篮球教学中,对于小学体育课中篮球教学的发展益处良多。体育教师可以将游戏作为打篮球前的热身运动,在篮球教学中加入游戏,将篮球基本功融入到游戏中的方式,是小学体育课程改革发展的需要。在研究了相关的策略后,得出以下结论,体育教师要因地制宜设计游戏,根据学生年龄应用游戏。如此,游戏法才能有效发挥出作用,帮助体育教师更好地进行小学篮球教学。
近年来,辽宁不断优化收入分配制度,居民收入实现稳步增长,与经济增长基本同步,城乡收入差距日趋缩小,收入结构不断优化,为促进共同富裕奠定了良好基础。但是由于疫情影响,近两年辽宁居民经营净收入出现负增长,导致居民收入阶段性放缓。同时,地区之间、行业之间以及不同收入群体之间还存在一定的收入差距。当前,保持辽宁经济平稳健康发展面临很多困难和挑战,进一步提高人民生活水平,促进共同富裕的任务仍十分艰巨和繁重。
<正>炎炎夏日,人们容易出现头痛、头晕甚至呕吐、腹泻等中暑症状。所以家中常会备些消暑药,以备不时之需,其中最为大家熟知的应该是藿香正气水了。在很多人的眼里,藿香正气水简直就是“中暑”的克星。其实,并非所有的中暑都适合服用藿香正气水,而且藿香正气水的作用也并非只能治疗中暑。
目的:分析小儿病毒性肠炎治疗期间采用藿香正气滴丸治疗方案的效果。方法:随机纳入185例小儿病毒性肠炎患儿,研究组93例实施藿香正气滴丸治疗,对照组92例实施对症支持治疗预防脱水。对比两组患儿治疗效果。结果:研究组的总有效例数为91例,总有效率为97.84%,对照组的总有效例数为82例,总有效率为89.13%,观察组的总有效率显著高于对照组,差异显著P <0.05;研究组在药物治疗后,止吐时间、止泻
自闭症学生由于身心发育障碍,导致他们课堂适应能力不强、问题行为较多,从而影响了正常的教育教学秩序。文章通过个案简介、课堂问题行为描述和原因分析,探索出自闭症儿童课堂问题行为干预方法,并对干预的过程和效果进行了分析和讨论。
德国哲学家韩炳哲被誉为“互联网时代的精神分析大师”和“大数据时代的哲学批判指南”。他敏锐地洞察到数字媒介社会下主体的生存困境,在深刻揭示社会弊病的同时,也将拯救社会的希望寄托于审美救赎,这展现出其思想的丰富性和前沿性。韩炳哲以数字媒介社会为背景,展开对审美救赎的独特思考,他的思想既有德国传统哲学家的深邃思辨,又将纯粹的理论与具体的社会现象相结合。本文将通过韩炳哲审美救赎思想的生成背景与理论渊源、主
实验是初中物理教学过程中的关键环节,学生观察物理现象、掌握物理知识等都要依靠物理实验。在物理教学中,教师应发挥自身的引导作用,帮助学生观察现象、分析数据、总结规律,进而构建良好的课堂氛围。当前,物理课堂实验方案的落实较为单一,教师对学生探究能力与实践能力的培养关注不足,导致物理实验教学难以发挥出其应有的作用。随着教学改革的推进,教师应引导学生积极思考、自主探究,提高初中物理教学的质量与效率。
目的:分析实施皮肾镜取石术的肾结石患者术后造瘘管护理中行层级干预模式的价值。方法:以2021年01月至2022年11月期间于本院实施经皮肾镜取石术治疗的350例肾结石患者为样本,依据患者手术时间顺序进行编号,奇数为对照组,偶数为观察组,对照组行常规护理,观察组实施层级干预,比较两组患者的护理效果、造瘘管不良事件发生率及生活质量。结果:观察组患者的尿液转清时间、置管时间、疼痛持续时间、住院时间均低于