基于神经网络的面罩语音识别方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户：gg499586617

【摘要】

：

全面罩是潜水员水下作业必不可少的设备之一,随着对海洋深入的探索,越来越多的智能设备被用到浅海水声通信及作业中。面罩语音识别作为人机交互的重要接口,给潜水员带来了极

【作者】

：

杜桂明

【出处】

：

河北工业大学

【发表日期】

：

2018年01期

【关键词】

：

面罩语音识别语音增强神经网络卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

全面罩是潜水员水下作业必不可少的设备之一,随着对海洋深入的探索,越来越多的智能设备被用到浅海水声通信及作业中。面罩语音识别作为人机交互的重要接口,给潜水员带来了极大的便利,对提高潜水员水下作业的效率,保障潜水员的生命安全有着重要的意义。考虑到实际环境中,会有各种海洋噪声的干扰,影响人机交互的正常进行。本文将语音增强算法和语音识别算法级联起来,先对带噪面罩语音做增强处理,然后对增强后的面罩语音进行识别,主要工作和研究内容如下:(1)面罩语音信号预处理。首先通过对比面罩语音和空气语音的语谱图来分析面罩语音的特性,结果显示面罩语音信号的高频分量削弱甚至丢失。然后对面罩语音信号进行了预处理及特征参数提取。(2)面罩语音增强算法研究。提出了一种改进的维纳滤波算法,在计算增益函数前先采用谱熵法检测面罩语音每一帧的状态,对无话帧进行噪声功率谱更新,同时引入增益控制参数,在增强面罩语音的同时,尽可能减少原始面罩语音失真。对比分析了增强后面罩语音的时域波形图和语谱图,研究表明该算法随着增益控制参数增大,残留噪声不断减小,若参数太大则会使得带噪面罩语音失真较为严重。与两种经典增强算法对比,改进的维纳滤波算法选择合理参数后,增强效果更好。(3)基于神经网络的面罩语音识别。采用BP神经网络、卷积神经网络(CNN)和长短时记忆神经网络(LSTM)进行面罩语音识别仿真实验,研究了不同结构的三种神经网络对面罩语音识别率的影响。并对CNN采用局部响应归一化(LRN)和Dropout进行优化,实验结果表明相对于BP神经网络和LSTM,CNN在孤立词面罩语音识别的任务上识别率更高。(4)带噪面罩语音识别方法研究。针对海洋背景噪声干扰,本文先对带噪面罩语音进行增强,然后采用CNN进行识别,通过对比分析,确定了模型的结构和参数。实验结果表明,改进的维纳滤波法与CNN相结合相对于谱减法与CNN相结合,在不同信噪比海浪噪声和海水噪声情况下识别率均提高;相对于维纳滤波法与CNN相结合,在不同信噪比海浪噪声情况下识别率更高,在高信噪比海水噪声情况下识别率更高,在低信噪比情况下识别率略低。

其他文献

中空纤维吸附材料吸附去除水中铜离子

利用一种使用方便的绳状中空纤维作为吸附剂,考察了其吸附去除水中铜离子的过程,探讨了溶液pH、吸附时间、铜离子初始浓度和竞争离子等因素对吸附性能的影响,并初步评价了该

期刊

吸附中空纤维铜离子

跌不完的A股

从目前趋势看，A股仍有“熊冠全球”之势。　　　　截至12月14日收盘，上证综指创下了2011年以来的新低2224点，累计跌幅已经达到了 18.39%，深证成指今年以来的跌幅则达到了24.74%。而在全球的主要市场当中，道琼斯工业平均指数今年累计上涨5.24% ，即使是在深陷债务危机的欧洲，伦敦富时100指数、巴黎 CAC40指数和法兰克福DAX指数跌幅也分别仅为6.97%、18.04% 和15.2

期刊

A股资本市场上证综指深证成指平均指数债务危机法兰克福跌幅

太子山下铸税魂——访临夏回族自治州国家税务局党组书记、局长李兴国

如今的巍巍太子山正在见证着临夏国税人铸就的辉煌业绩。截至9月28日，临夏回族自治州国税局累计完成税收收入44868．64万元，比上年同期增收11954．08万元，增长36．32％，这是自2000年以来，

期刊

临夏回族自治州国家税务局党组书记李兴国太子局长税收收入任务记者采访

大鼠同种异系颈总动脉移植模型的构建和评价及初步探讨阿托伐他汀对本模型的影响

研究目的近年来各外科器官移植手术、心血管内科介入手术、心脏外科血管搭桥手术广泛开展,这些手术有一些共同的特点,无论是外来的移植器官、金属支架,或是自体的静脉移植,都

学位

器官移植慢性排斥炎症反应TNF-αIL-6动脉移植大鼠模型阿托伐他汀

第三方物流参与的供应链跨链间协调——基于系统动力学的仿真研究

采用系统动力学模拟仿真方法,考虑第三方物流参与的,两条供应链跨链间的协调问题。研究发现,基于批发商处双向库存补充策略的跨链间库存协调,在总体库存水平、顾客需求满足率

期刊

供应链第三方物流跨链协调系统动力学

基于神经网络的面罩语音识别方法研究

其他学术论文