基于场景匹配的双耳助听器语音增强算法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:GoldGhost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前双耳助听器语音增强模块中主要应用的是自适应波束形成算法进行去噪,该算法对于环境依赖度较高且对于非平稳噪声去除效果较差。因此,本文拟采用一种基于场景匹配的双耳助听器语音增强算法,该算法从双耳数字助听器中的语音增强、声源定位和场景匹配等关键技术的研究出发,通过声源定位算法提取空间信息确保空间信息的完整度同时通过空间滤波将与语音不同方向的噪声滤除,将接收到的多通道语音信号化简为单通道语音信号,然后利用场景匹配检测背景环境。针对现在的场景匹配算法复杂度较高且适应环境较少,本文采用一种基于多特征融合的数字助听器场景匹配算法,该算法对语音段和噪声段分别融合多个特征参数,采用改进的加权最小距离分类实现适用于数字助听器的场景匹配算法。然后根据匹配结果采用相对应的语音增强算法进行去噪处理,最后根据HRTF模型恢复空间信息,达到增强的目的。语音增强算法通常是在对语音和噪声的频谱特性做出了某些设想的前提下得到的,正因为此,语音增强算法会在具有不同频谱特征的噪声场景下性能表现出差异。本文算法将双耳助听器中常用的多通道增强转换为单声道增强,降低计算复杂度,同时保留多声道声音具有空间信息的特点,并可以针对不同背景噪声环境分别处理。本课题的研究对双耳智能数字助听器的改革和推广具有重要的现实意义。本课题的研究工作大体分为三部分:(1)声源定位算法研究:现有的双耳数字助听器声源定位算法,虽然有着不错的定位能力,但是都不能适用于多场景,精确度高并且算法复杂度低的双耳数字助听器中。在对前人的声源定位算法进行深入分析的基础上,提出了一种新的双耳声源定位算法,首先将双耳声源信号通过Gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着通过计算头相关函数相关参数并首次引入高斯混合模型进行声源定位,去除与声源不同方向的噪声,大大减少了之后语音增强模块的运算复杂度。(2)场景匹配算法研究:现有的听觉场景匹配算法,虽然匹配精度相对理想,但其适用噪声场景不多,难以满足在复杂环境下工作的数字助听器的性能要求。基于现有的听觉场景匹配算法进行深入研究,找到一种适用于智能数字助听器的听觉场景匹配算法。为了适用更多的场景,并提高匹配精度,本文使用基于分带谱熵和谱能量的端点检测算法将待测的带噪语音分为语音段和噪声段,针对语音段和噪声段分别确定需要提取的特征参数,噪声段提取分带谱熵、短时过零率和临界带能量比,语音段则只提取分带谱熵和临界带能量比,最后采用匹配精度较好,计算复杂度较低的符合数字助听器实际应用要求的加权最小距离分类算法对带噪语音进行语音噪声环境场景匹配。(3)最佳语音增强算法选择:不同的噪声具有不同的特性,针对它们各自的特性进行去噪处理可以提升语音增强模块的去噪性能。通过噪声库中的各种噪声进行大量去噪性能实验总结出对每种噪声去噪效果最佳的语音增强方法并有针对性的进行去噪处理。实验结果表明,本文所提出的基于Gammatone滤波器分解的头相关函数和高斯混合模型融合的双耳声源定位算法无论在鲁棒性、定位精度还是计算复杂度都优于参考算法。本文提出的基于多特征融合和加权最小距离分类的数字助听器场景匹配算法除了能适用于更多的噪声场景外,还提高了多场景匹配的精确度,并且计算复杂度远小于参考方法。使用针对性的语音增强方法进行去噪处理也使得各个噪声的去噪效果达到最佳。本文构建的基于场景匹配的双耳语音增强系统比参考算法拥有更佳的去噪性能。
其他文献
文中首先分析了PCI总线的基本规范,在此基础上研究了接口芯片S5933的结构和工作原理.在硬件设计中使用FPGA实现了帧时钟生成、驱动信号生成、FIFO控制和接口芯片控制等功能,
跳频通信技术,由于其载频受一伪随机码控制不断跳变,且规律十分复杂,因此具有很高的保密性和抗干扰性,在军事领域得到了广泛的应用。在对跳频信号进行侦察接收时,解跳是其中的关键
该文首先介绍了会议电视系统的总体框架结构:会议电视系统的组网方式、多点控制单元(MCU)结构和多媒体视听终端结构.同时议论介绍了远程访问服务器的基本原理和微软的Netmeet
该论文的研究重点是以IBM公司推出的IBM Power Network Processor NP4GS3为模板,在对其分组调度和队列管理机理进行深入研究的基础上,给出了一套完整的实现方案并进行了详细
由于毫米波成像具有较好的穿透性和较高的空间分辨率,因此毫米波无源成像技术被广泛的应用于遥感、导航和安检等军事或民事领域。本文在分析和总结被动毫米波成像原理及其系
原子时标在当今社会中,特别是军事、航天等领域有着重要的应用。为了提高中国原子时标准确度和稳定度,本文结合当前时间尺度算法研究现状,依据国际计量局(BIPM)计算原子时标的思
现代相控阵雷达由于其优良的性能和灵活的处理功能,获得了广泛的应用。本文主要结合相控阵雷达制导站信号处理机的研制,论述了如何在相控阵雷达中实现动目标显示、动目标检测、
该文主要研究利用分集接收技术和纠错编码技术对抗CDMA卫星移动通信信道衰落的问题,内容主要涉及RAKE接收机、多星分集、多星分集、空间分集、纠错编码及它们的综合应用.
该文就各种经典与现代静止图象压缩方法以及低比特率活动图像编码与传输的原理和方法进行了探讨.针对监控图像背景图像固定,活动内容较少的特点,在对各种视频编码国际标准进
该文重点介绍作者在这个项目中所做的工作,主要包括以下几个方面:1.通过对全数字化实现多载波QPSK调制/解调基本理论的研究,参与了一些算法的讨论和应用DSP实现这些算法的研