论文部分内容阅读
目前双耳助听器语音增强模块中主要应用的是自适应波束形成算法进行去噪,该算法对于环境依赖度较高且对于非平稳噪声去除效果较差。因此,本文拟采用一种基于场景匹配的双耳助听器语音增强算法,该算法从双耳数字助听器中的语音增强、声源定位和场景匹配等关键技术的研究出发,通过声源定位算法提取空间信息确保空间信息的完整度同时通过空间滤波将与语音不同方向的噪声滤除,将接收到的多通道语音信号化简为单通道语音信号,然后利用场景匹配检测背景环境。针对现在的场景匹配算法复杂度较高且适应环境较少,本文采用一种基于多特征融合的数字助听器场景匹配算法,该算法对语音段和噪声段分别融合多个特征参数,采用改进的加权最小距离分类实现适用于数字助听器的场景匹配算法。然后根据匹配结果采用相对应的语音增强算法进行去噪处理,最后根据HRTF模型恢复空间信息,达到增强的目的。语音增强算法通常是在对语音和噪声的频谱特性做出了某些设想的前提下得到的,正因为此,语音增强算法会在具有不同频谱特征的噪声场景下性能表现出差异。本文算法将双耳助听器中常用的多通道增强转换为单声道增强,降低计算复杂度,同时保留多声道声音具有空间信息的特点,并可以针对不同背景噪声环境分别处理。本课题的研究对双耳智能数字助听器的改革和推广具有重要的现实意义。本课题的研究工作大体分为三部分:(1)声源定位算法研究:现有的双耳数字助听器声源定位算法,虽然有着不错的定位能力,但是都不能适用于多场景,精确度高并且算法复杂度低的双耳数字助听器中。在对前人的声源定位算法进行深入分析的基础上,提出了一种新的双耳声源定位算法,首先将双耳声源信号通过Gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着通过计算头相关函数相关参数并首次引入高斯混合模型进行声源定位,去除与声源不同方向的噪声,大大减少了之后语音增强模块的运算复杂度。(2)场景匹配算法研究:现有的听觉场景匹配算法,虽然匹配精度相对理想,但其适用噪声场景不多,难以满足在复杂环境下工作的数字助听器的性能要求。基于现有的听觉场景匹配算法进行深入研究,找到一种适用于智能数字助听器的听觉场景匹配算法。为了适用更多的场景,并提高匹配精度,本文使用基于分带谱熵和谱能量的端点检测算法将待测的带噪语音分为语音段和噪声段,针对语音段和噪声段分别确定需要提取的特征参数,噪声段提取分带谱熵、短时过零率和临界带能量比,语音段则只提取分带谱熵和临界带能量比,最后采用匹配精度较好,计算复杂度较低的符合数字助听器实际应用要求的加权最小距离分类算法对带噪语音进行语音噪声环境场景匹配。(3)最佳语音增强算法选择:不同的噪声具有不同的特性,针对它们各自的特性进行去噪处理可以提升语音增强模块的去噪性能。通过噪声库中的各种噪声进行大量去噪性能实验总结出对每种噪声去噪效果最佳的语音增强方法并有针对性的进行去噪处理。实验结果表明,本文所提出的基于Gammatone滤波器分解的头相关函数和高斯混合模型融合的双耳声源定位算法无论在鲁棒性、定位精度还是计算复杂度都优于参考算法。本文提出的基于多特征融合和加权最小距离分类的数字助听器场景匹配算法除了能适用于更多的噪声场景外,还提高了多场景匹配的精确度,并且计算复杂度远小于参考方法。使用针对性的语音增强方法进行去噪处理也使得各个噪声的去噪效果达到最佳。本文构建的基于场景匹配的双耳语音增强系统比参考算法拥有更佳的去噪性能。