论文部分内容阅读
全面罩是潜水员水下作业必不可少的设备之一,随着对海洋深入的探索,越来越多的智能设备被用到浅海水声通信及作业中。面罩语音识别作为人机交互的重要接口,给潜水员带来了极大的便利,对提高潜水员水下作业的效率,保障潜水员的生命安全有着重要的意义。考虑到实际环境中,会有各种海洋噪声的干扰,影响人机交互的正常进行。本文将语音增强算法和语音识别算法级联起来,先对带噪面罩语音做增强处理,然后对增强后的面罩语音进行识别,主要工作和研究内容如下:(1)面罩语音信号预处理。首先通过对比面罩语音和空气语音的语谱图来分析面罩语音的特性,结果显示面罩语音信号的高频分量削弱甚至丢失。然后对面罩语音信号进行了预处理及特征参数提取。(2)面罩语音增强算法研究。提出了一种改进的维纳滤波算法,在计算增益函数前先采用谱熵法检测面罩语音每一帧的状态,对无话帧进行噪声功率谱更新,同时引入增益控制参数,在增强面罩语音的同时,尽可能减少原始面罩语音失真。对比分析了增强后面罩语音的时域波形图和语谱图,研究表明该算法随着增益控制参数增大,残留噪声不断减小,若参数太大则会使得带噪面罩语音失真较为严重。与两种经典增强算法对比,改进的维纳滤波算法选择合理参数后,增强效果更好。(3)基于神经网络的面罩语音识别。采用BP神经网络、卷积神经网络(CNN)和长短时记忆神经网络(LSTM)进行面罩语音识别仿真实验,研究了不同结构的三种神经网络对面罩语音识别率的影响。并对CNN采用局部响应归一化(LRN)和Dropout进行优化,实验结果表明相对于BP神经网络和LSTM,CNN在孤立词面罩语音识别的任务上识别率更高。(4)带噪面罩语音识别方法研究。针对海洋背景噪声干扰,本文先对带噪面罩语音进行增强,然后采用CNN进行识别,通过对比分析,确定了模型的结构和参数。实验结果表明,改进的维纳滤波法与CNN相结合相对于谱减法与CNN相结合,在不同信噪比海浪噪声和海水噪声情况下识别率均提高;相对于维纳滤波法与CNN相结合,在不同信噪比海浪噪声情况下识别率更高,在高信噪比海水噪声情况下识别率更高,在低信噪比情况下识别率略低。