DFSMN-T:结合强语言模型Transformer的中文语音识别

来源 :计算机工程与应用 | 被引量 : 4次 | 上传用户:xp509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语音识别系统由声学模型和语言模型两部分构成,但传统语言模型N-gram存在忽略词条语义相似性、参数过大等问题,限制了语音识别字符错误率的进一步降低。针对上述问题,提出一种新型的语音识别系统,以中文音节(拼音)作为中间字符,以深度前馈序列记忆神经网络DFSMN作为声学模型,执行语音转中文音节任务,进而将拼音转汉字理解成翻译任务,引入Transformer作为语言模型;同时提出一种减少Transformer计算复杂度的简易方法,在计算注意力权值时引入Hadamard矩阵进行滤波,对低于阈值的参数进行丢弃,使得模型解码速度更快。在Aishell-1、Thchs30等数据集上的实验表明,相较于DFSMN结合3-gram模型,基于DFSMN和改进Transformer的语音识别系统在最优模型上的字符错误率相对下降了3.2%,达到了11.8%的字符错误率;相较于BLSTM模型语音识别系统,其字符错误率相对下降了7.1%。
其他文献
学位
实验室分析工作的实施对于促进环境检测工作质量而言有着极为重要的意义,是环保工作中的重要构成部分,能够真正带领社会在更为优质的生态环境中良好前进。因此,如何强化实验室分析工作的合理性、确保数据信息的真实准确和科学处理是相关人员需要积极思考的内容,这样能够在最大程度上减少环境检测工作中的误差,切实有效地提升环境管理工作的质量,使我国的环境质量能够获得最大程度上的改善。本文对现阶段环境检测实验室的工作方
2020年,教育部修订了《普通高中英语课程标准(2017年版)》,强调课程内容应以主题为引领,使其情境化,借此进一步落实英语学科核心素养。2021年6月,江苏高考英语首次采用新高考全国卷I,在写作部分引入"读后续写"这一新题型。当前,在高中英语写作教学过程中,由于部分教师过于注重写作的输出结果,所创设的语境大多脱离学生的现实生活,导致学生丧失写作任务的兴趣,继而致使写作效果不理想。基于上述分析的基
<正>近日,国家发展改革委、科技部、工业和信息化部、自然资源部和国家开发银行等5部门发布了《“十四五”支持老工业城市和资源型城市产业转型升级示范区高质量发展实施方案》(以下简称《实施方案》),《实施方案》作为《“十四五”特殊类型地区振兴发展规划》的配套政策文件,准确把握我国老工业城市和资源型城市振兴发展的阶段性特征,聚焦推进产业转型升级示范区建设,统筹谋划相关措施,总体思路与国家创新驱动发展战略、
期刊
本试验通过6周的养殖试验研究饲料胆固醇水平对克氏原螯虾(Procambarus clarkii)生长性能、体组成、消化酶活性、抗氧化能力和脂代谢相关基因表达的影响。试验配制胆固醇添加水平分别为0(C0)、0.25%(C0.25)、0.50%(C0.50)、0.75%(C0.75)、1.00%(C1.00)的5种等氮试验饲料,饲料中胆固醇实测水平分别为0.06%、0.29%、0.54%、0.81%和
空中课堂作为优质的视频课资源,逐渐成为课堂教学的重要参考。通过个案研究,利用洛克伦内容表征(CoRe)-教学经验(PaP-eRs)模型作为研究工具,剖析教师在利用空中课堂资源过程中,如何促进自身学科教学知识的发展。研究发现教师在学科知识、教学策略与方法的理解上得到较大提升,在关于学生知识的层面提升较为有限。
学位
<正>高中阶段英语读后续写是高考的一种较新题型,也是提升学生英语综合应用能力的一个重要途径。随着教育改革的不断深入,读后续写已经成为高中英语一项重要的教学内容。如何提升高中英语读后续写教学水平,如何提升学生审题和文章构建水平,是当前高中英语教学的一项重要内容。本文结合高中英语读后续写教学,来探讨在教学课堂上如何做好读后续写的教学工作。从阅读材料中发现文章,从材料中找寻关键语句,深入分析如何进行高中
期刊
高校辅导员是大学生思想政治工作的重要队伍。新形势下,高校辅导员责任艰巨,使命重大,要真正做到用习近平新时代中国特色社会主义思想铸魂育人。政治强、情怀深是辅导员铸魂育人的根本,讲政治是马克思主义政党的根本要求,辅导员始终要把坚定正确的政治方向放在第一位;有情怀是辅导员铸魂育人的力量源泉,辅导员既要秉持深厚的家国情怀,更要兼具人道主义情怀,把热爱植根于内心。视野广、思维新是辅导员铸魂育人的底色,视野广