基于DL-T及迁移学习的语音识别研究

来源 :工程科学学报 | 被引量 : 0次 | 上传用户:zs297481492
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决RNN-T语音识别时预测错误率高、收敛速度慢的问题,本文提出了一种基于DL-T的声学建模方法.首先介绍了RNN-T声学模型;其次结合DenseNet与LSTM网络提出了一种新的声学建模方法——DL-T,该方法可提取原始语音的高维信息从而加强特征信息重用、减轻梯度问题便于深层信息传递,使其兼具预测错误率低及收敛速度快的优点;然后,为进一步提高声学模型的准确率,提出了一种适合DL-T的迁移学习方法;最后为验证上述方法,采用DL-T声学模型,基于Aishell-1数据集开展了语音识别研究.研究结果表明:D
其他文献
洙边铜多金属矿位于滨西太平洋成矿域,莒南成矿区。区内岩浆岩出露燕山晚期石英二长岩、正长岩及石英正长斑岩。断裂构造较发育,视极化率异常与化探异常吻合。该区已发现铜矿
南岭东段早燕山中晚期(170Ma~140Ma)岩浆岩广泛分布,侵入岩十分发育,本文统计的部分岩浆岩年龄(66个)时间段为165Ma~140Ma,几乎为酸性侵入岩,并与之伴生大量钨矿。本文统计钨
氮化碳作为一种具有高催化性能的光催化剂,具有无毒无害,自然环境下稳定的性质,在水解制氢气氧气以及降解有机污染物领域得到了广泛的关注.其中类石墨相氮化碳(g-C_(3)N_(4))
(In,Co)共掺的ZnO薄膜(ICZO薄膜)在100℃下通过射频(RF)溅射沉积至玻璃基板上.沉积过程采用In、Co、Zn三靶共溅射.通过调节靶功率,获得了不同In含量的ICZO薄膜.研究了不同In
基于人机动态协同控制的车道保持辅助系统有助于兼顾汽车的安全性与驾驶员的舒适性,分析了该系统在车道偏离决策模型、驾驶权动态分配及性能评估等方面的研究现状和发展趋势.
通过挥发-冷凝实验装置进行小型烧结实验,运用X射线荧光光谱(XRF)、扫描电镜-能谱仪(SEM-EDS)及电感耦合等离子体发射光谱仪(ICP-OES)等分析检测手段,结合Factsage热力学模拟
提出一种以燃料消耗量最小为优化目标的加热炉生产调度新方法.首先基于热力学第一定律分析了流入及流出加热炉的各项能量,并对燃料消耗量的计算式进行了理论推导.进而根据加
强降雨作用下排土场非饱和带中的孔隙气压力会阻碍散土体的雨水入渗,从而进一步影响排土场的安全稳定.然而传统分析方法往往将孔隙气压力视为大气压力而忽略其对排土场安全的
在素质教育强调创新教学评价形式的背景下,延时评价和即时评价已然成为新时期教育工作者开展教学评价的左膀右臂。两者的区别就在于评价的时间,即时评价能够通过学生所反馈的