基于数据加噪和文语对齐的声学模型训练

来源 :山西大学 | 被引量 : 1次 | 上传用户:QUFENGJUN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在AI时代,语音由于比文字自然高效而更受人机交互领域的青睐。语音识别,即系统把语音信号输入转变为文字输出的过程。声学模型作为语音识别系统的核心模块,主流训练方式为深度神经网络隐马尔可夫模型(DNN-HMM)。训练声学模型是通过输入语音数据和标注文本数据对模型参数进行调优的过程。语音数据越充足,标注文本越准确,训练后模型泛化能力越强。然而现阶段存在如下问题:(1)训练数据获取难,训练数据资源匮乏。(2)人工根据语音转写标注文本时,由于键盘输入有误或者人工理解偏差,不可避免会出现少字多字错字等现象,导致标注文本数据不准确,如果将这类数据用于声学训练,会降低模型的泛化能力。(3)传统声学训练的语音数据是安静环境下录制的音频,训练得到的模型在噪声背景下往往识别率很低。针对以上三点不足,本文展开了以下工作:(1)借鉴图像识别采用加噪进行数据增强的思路,本文选取机场、汽车、街道和火车4种噪声,采用Python程序对音频数据进行了加噪处理。通过数据加噪,一是解决了训练数据的获取难题,二是模拟噪声背景的声学模型训练,提升系统在噪声环境的鲁棒性。(2)针对标注文本不正确,本文在传统强制对齐(将语音和标注文本对齐的操作,属于文语对齐方式的一种)基础上,采用前向算法和后向算法,先对语音进行一次识别,将结果以词图形式储存,采用后验概率做搜索结果确认后,将语音识别结果与标注文本进行对比,剔除错误率较高的标注文本数据和相应音频数据,将剩余数据用作模型训练,我们将这一文语对齐方式称作词图对齐。(3)依据音频数据是否加噪和标注文本是否词图对齐,本文进行了加噪实验和对齐实验。实验结果显示,两组方法无论是单独使用,还是结合使用,都会一定程度提升语音识别系统的识别率,说明本文方法确实具备可行性。
其他文献
医疗仪器设备及器械制造产业作为高技术产业,已经成为保障人民健康和支撑国民经济的中坚力量,随着我国装备制造逐步向高端产业升级,我国医疗仪器及设备制造业不断满足国内需求并开始进入国际市场的进程中,不仅面临国际先进企业的竞争,也充满了发展机遇。分析我国医疗仪器设备机器制造业的产业环境及其竞争力,并提出发展对策具有很强的现实意义。本文通过对国内外知名学者的文献进行研究分析,并结合我国医疗仪器设备及器械制造
近年来,随着经济社会发展,电网不断升级改造,为了提高供电可靠性、稳定性,同时能够节约土地资源,气体绝缘组合电器(GIS)应运而生,在辽宁电网220kV及以上电压等级的变电站中大量运用。与此同时,GIS设备检修工作较为复杂以及检测方式缺乏多样性的问题随之而来。本研究结合本人现场实际工作经历,同时结合阜新电网两个典型个案展开分析,着重分析了特高频法(UHF法)局部放电检测在阜新电网GIS设备中的应用进
通过K/Na离子交换方法在掺CdSxSe1-x玻璃表面制成单模光波导,采用三种不同的光束耦合方式观测到了棱镜非线性波导耦合本征光学双稳态。更多还原
本文介绍了电热隧道窑微机控制系统的各主要部分及通用微机作为控制机的许多优点。研制具有自处理功能的接口卡是技术关键,人——机对话、现场修改也是本系统的特点。
我国新一轮课程改革已经进行了十多年,随着课程改革的深入,越来越多的教师意识到改变传统观念的必要性。英语教学不再过于注重语法和知识的教学,而是真正提倡根据学生的兴趣
新工科建设是高等工程教育改革的重大举措,本文以新工科人才培养为导向,对照工程管理专业人才需求,按照人才培养体系、专业教师队伍建设、实践教学体系及学生学风建设等四个
当前,农村商业银行面临经济新常态与金融监管趋严的双层压力,银行间的竞争以及互联网金融的竞争也愈演愈烈。面对新形势,农村商业银行只有坚守"做小做散"的战略定位,强化绩效
我国人口老龄化程度严重,国家用于养老事业的资金有限,出现“未富先老”的社会现象。面对庞大的老龄人口,我国养老服务供给严重不足。此外,随着经济社会的不断发展,老年人的养老服务需求日益多元化,对养老服务的要求也越来越高。社区嵌入式养老模式作为新型养老模式,集中了社区养老和机构养老的优势,在养老服务供给方面具有较大优势。但由于模式经验不足,社区嵌入式养老服务还需要进一步发展。笔者在Z机构任职实习社工一年
由于GRIN球透镜的光线轨迹为通过对称中心的平面曲线,所以本文研究了折射率呈二次抛物线型的GRIN球透镜在极坐标下的光线轨迹方程式。
福瑞鲤(Cyprinus carpio),属鲤形目(Cyprini-formes)、鲤科(Cyprinidae)、鲤亚科(Cyprinae)、鲤属(Cyprinus)、鲤种(Cyprinus carpio),英文名为FFRC strain common carp。它的原始亲本为