基于深度LSTM的端到端的语音识别

来源 :中北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:hong_77521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分类的训练准则进行模型训练,搭建端到端语音识别系统,解决了隐马尔可夫模型需要将标签和序列强制对齐的问题.实验表明,深度LSTM可以提高语音建模的性能,相比使用标准LSTM的模型,在准确率方面提高约4%.
其他文献
分析了甜玉米粒的相关物理属性如球度、千粒重、体积密度、真密度、孔隙率、自由沉降速度等,对甜玉米粒的表皮特性进行了研究,为深入研究玉米工业皮渣超细粉碎提供了可靠的实验
为了加深对复杂的现象总体总量指标变动的多因素分析,笔者采用了三因素共变影响指数的方法,以期为完善统计指数理论提供参考.结果表明:1)在复杂现象总体总量指标变动的多因素
江苏省常州市新北区河海街道阳光社区是一个治安情况复杂的小区,既有自然村,也有高档社区,还有30多家企业。这里有一名50多岁的片警王瑞生。他扎根社区一干就是11年,居民们佩
研究了铜精矿催化加压浸取净化除铁后,料液中铜镍的萃取分离及串级模拟实验.采用 LIX984萃取剂,在料液pH=4.0时铜镍分离效果较为理想.除铜后的料液,用P204萃取富集镍.经硫酸
人力资源风险管理并非仅限于对员工的风险管理与防范。随着心理资本理论的发展,基于心理资本的人力资源风险管理需要从心理资本的内涵挖掘上,通过构建以风险识别、风险分析、
国内外建筑物地基基础不均匀沉降引起了大量的工程事故,轻则房屋墙体幵裂,重则房屋结构整体或局部倾斜甚至倒塌,既有建筑改造增加的荷载是引起基础不均匀沉降的重要因素.对北
目前,家庭教育存在着许多误区,家长迫切需要得到科学的家庭教育指导,而家庭教育指导的现状与家长的实际需求存在脱节的现象。昆山市教育局在以"共育、共建、共享、共生"为目
目的:探究南方红豆杉水提物含药血清联合吉非替尼含药血清对A549细胞株增殖的影响。方法:新西兰纯家兔26只,雌雄各半,随机分成6组,即对照组(0.9%氯化钠溶液),南方红豆杉水提物
本文通过将设计作品中最常出现的传统吉祥图案在形式结构的提取与创造、意境神韵的把握与延伸、色彩的借鉴与衍生、气势的沿用与传承四个方面的运用进行探讨,提出传统吉祥图
"垮掉一代"(Beat)指美国20世纪五六十年代对其社会不满的部分青年,又指一种文学思潮.Beat根植于美国的超验主义哲学,思想激进,对工业化持怀疑态度,渴望人与自然的最初状态,颂