基于神经网络的面罩语音识别方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:gg499586617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全面罩是潜水员水下作业必不可少的设备之一,随着对海洋深入的探索,越来越多的智能设备被用到浅海水声通信及作业中。面罩语音识别作为人机交互的重要接口,给潜水员带来了极大的便利,对提高潜水员水下作业的效率,保障潜水员的生命安全有着重要的意义。考虑到实际环境中,会有各种海洋噪声的干扰,影响人机交互的正常进行。本文将语音增强算法和语音识别算法级联起来,先对带噪面罩语音做增强处理,然后对增强后的面罩语音进行识别,主要工作和研究内容如下:(1)面罩语音信号预处理。首先通过对比面罩语音和空气语音的语谱图来分析面罩语音的特性,结果显示面罩语音信号的高频分量削弱甚至丢失。然后对面罩语音信号进行了预处理及特征参数提取。(2)面罩语音增强算法研究。提出了一种改进的维纳滤波算法,在计算增益函数前先采用谱熵法检测面罩语音每一帧的状态,对无话帧进行噪声功率谱更新,同时引入增益控制参数,在增强面罩语音的同时,尽可能减少原始面罩语音失真。对比分析了增强后面罩语音的时域波形图和语谱图,研究表明该算法随着增益控制参数增大,残留噪声不断减小,若参数太大则会使得带噪面罩语音失真较为严重。与两种经典增强算法对比,改进的维纳滤波算法选择合理参数后,增强效果更好。(3)基于神经网络的面罩语音识别。采用BP神经网络、卷积神经网络(CNN)和长短时记忆神经网络(LSTM)进行面罩语音识别仿真实验,研究了不同结构的三种神经网络对面罩语音识别率的影响。并对CNN采用局部响应归一化(LRN)和Dropout进行优化,实验结果表明相对于BP神经网络和LSTM,CNN在孤立词面罩语音识别的任务上识别率更高。(4)带噪面罩语音识别方法研究。针对海洋背景噪声干扰,本文先对带噪面罩语音进行增强,然后采用CNN进行识别,通过对比分析,确定了模型的结构和参数。实验结果表明,改进的维纳滤波法与CNN相结合相对于谱减法与CNN相结合,在不同信噪比海浪噪声和海水噪声情况下识别率均提高;相对于维纳滤波法与CNN相结合,在不同信噪比海浪噪声情况下识别率更高,在高信噪比海水噪声情况下识别率更高,在低信噪比情况下识别率略低。
其他文献
利用一种使用方便的绳状中空纤维作为吸附剂,考察了其吸附去除水中铜离子的过程,探讨了溶液pH、吸附时间、铜离子初始浓度和竞争离子等因素对吸附性能的影响,并初步评价了该
从目前趋势看,A股仍有“熊冠全球”之势。    截至12月14日收盘,上证综指创下了2011年以来的新低2224点,累计跌幅已经达到了 18.39%,深证成指今年以来的跌幅则达到了24.74%。而在全球的主要市场当中,道琼斯工业平均指数今年累计上涨5.24% ,即使是在深陷债务危机的欧洲,伦敦富时100指数、巴黎 CAC40指数和法兰克福DAX指数跌幅也分别仅为6.97%、18.04% 和15.2
如今的巍巍太子山正在见证着临夏国税人铸就的辉煌业绩。截至9月28日,临夏回族自治州国税局累计完成税收收入44868.64万元,比上年同期增收11954.08万元,增长36.32%,这是自2000年以来,
研究目的近年来各外科器官移植手术、心血管内科介入手术、心脏外科血管搭桥手术广泛开展,这些手术有一些共同的特点,无论是外来的移植器官、金属支架,或是自体的静脉移植,都
采用系统动力学模拟仿真方法,考虑第三方物流参与的,两条供应链跨链间的协调问题。研究发现,基于批发商处双向库存补充策略的跨链间库存协调,在总体库存水平、顾客需求满足率