噪声环境下的轻量化语音识别技术研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ad5260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别技术在不同场景下的应用需求骤增,其在复杂场景下的实用性得到了学术界与工业界的共同关注。在多样化的场景下,如车载环境中的语音识别、嘈杂环境中终端设备上的语音识别、以及工厂环境中物联网设备上的语音识别等。这些场景下由于环境噪声的影响,造成语音识别系统的识别性能降低,无法保证系统在不同场景下的鲁棒性。另一方面,传统的语音识别模型结构复杂,由基于隐马尔可夫(GMM-HMM)的声学模型(AM)、语言模型(LM)、字典和解码器构成。此类语音识别技术往往基于统计模型,模型结构中包含多个目标函数。因此在多目标条件下,训练过程中不易学到适合整体模型的最优权重。同时,现存的语音识别模型还存在着参数量巨大,不易部署在资源受限的终端设备上的问题。基于上述问题,本文从语音特征优化、模型设计方面出发,提出相应的优化方法。具体而言,在语音特征方面,提出一种基于稀疏表示的语音特征增强算法,以应对在不同场景下语音识别系统的鲁棒性问题;在模型设计方面,提出一种结构简单、模型轻巧、易于部署的轻量化端到端语音识别模型。本文所做具体工作内容如下:(1)为了解决语音数据Y中由背景噪音或自身噪音所带来的干扰问题,本文结合压缩感知领域的知识,提出一种基于稀疏表示的语音特征增强算法。由于数据信号自身的特点,如语音信号、图像信号等是可以被稀疏的,而噪声信号不能被稀疏。因此可通过语音特征的稀疏表示将携带有用信息的特征和噪声特征分离,同时保留了语音信号的本质特征。本文讨论了所提出的语音特征增强算法与其它传统数据增强算法的性能差异,实验结果表明,本文提出的算法要优于wiener滤波算法、谱减法等传统数据增强算法,并在多种噪声场景下提高了语音识别系统的识别性能。同时,我们还探讨了该算法在多模态语音识别系统下的性能,在多模态语音识别系统下特征增强算法仍具有优势。(2)本文提出一种轻量化的端到端语音识别模型CNN1D-CTC,该模型由一维卷积神经网络(Convolutional Neural Networks)和CTC(Connectionist Temporal Classification)分类算法构成。模型结构简单,与其它模型相比参数量较少,模型占用内存资源较小,因此易部署在资源受限的小型终端设备上。同时CNN1D-CTC模型为端到端的语音识别模型,可通过神经网络学习的方式自适应的将语音数据和标签在帧级别进行对齐。因此,本文提出的CNN1D-CTC模型在达到更高识别性能的同时减小了模型参数量,具有轻量化的特征。此外,以该端到端语音识别模型为基础模型,在此基础模型上对不同特征作为输入时的系统性能做出了探究。实验表明多模态特征作为输入时的识别性能要优于单模态特征下的识别性能。
其他文献
学位
政策环评公众参与是促进决策公开透明的重要抓手,对促进公民环境权益实现、完善源头预防体系、支撑环境治理模式创新、推进新时期生态文明建设意义重大。但我国政策环评及其公众参与开展较晚,发展缓慢,仍存在许多亟待解决的问题。本文梳理了政策环评公众参与的制度发展、实践进展及研究现状;构建了涵盖公众主体、参与时机、参与方式、信息获取、意见采纳及反馈5个要素的有效公众参与框架;分析了现阶段我国环评公众参与的问题,
期刊
发展特色产业是壮大县域经济实力和提升县域综合竞争力的重要支柱,有助于增强地方产业的综合竞争力,还能集中各种生产要素,推动一二三产业融合发展。调查现阶段东兰县特色农业产业发展现状,截至2021年底,全县油茶种植面积达1.97万hm~2,油茶产品精加工率高达80%以上,茶油年产量达4 000多t以上,年产值突破3亿元以上;全县特色水果种植基地面积达0.38万hm~2;生猪、肉牛和肉羊分别出栏9.65万
期刊
复发性流产(RSA)是指3次或3次以上于妊娠28周之前的胎儿丢失,目前认为连续发生2次流产即应重视并予评估。RSA发病机制较为复杂,目前已知的病因包括流行病学因素、子宫结构异常、血栓前状态、遗传因素、内分泌因素、感染因素、免疫因素、其他因素(如不良环境因素、压力因素等),但仍有50%~60%的病例无法解释。近年来RSA与血栓前状态的关系成为国内外的研究热点,遗传性易栓症包括蛋白C、蛋白S和抗凝血酶
期刊
学位
报纸
学位
学位
学位
病案管理的含义有广义和狭义之分。狭义的概念指对病案的物理性质的管理,即对病案资料的回收、整理、装订、编号、归档和提供等工作程序。广义病案是指卫生信息管理,即不仅对病案物理性质的机械性管理,而且还对病案记录的内容进行深加工,提炼出消息,如建立较为完整的索引系统,对病案中的有关资料分类加工、分类统计,对收集的资料的质量进行监控,向医务人员、医院管理人员及其他信息的使用人员提供高质量的为什么信息服务。所
期刊