扩声系统反馈声控制与去混响研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wuzhen16885168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
扩声系统广泛应用于影剧院、报告厅、会议室、教室等公共场所。在扩声系统中,传声器接收到的信号不仅包括声源的直达声信号,还包括扬声器的反馈声信号,以及声源由于墙壁、地面、顶棚等障碍物的反射、散射形成的混响信号。反馈声的存在使得扩声系统成为一个闭环系统从而可能出现不稳定的啸叫现象,影响扩声效果,严重时会导致系统崩溃,因此,啸叫是扩声系统中首要解决的问题。而长时间混响会严重影响传声器语音信号的质量与可懂度,通过去混响可以提高扩声系统中的语音可懂度,因此研究去混响技术在扩声系统中的应用具有重要的研究和应用价值。  针对反馈声控制以及去混响中的若干关键技术问题,开展了理论和实验研究,提出了相应的解决方案。反馈声控制包括啸叫抑制与反馈声消除:啸叫抑制通过检测啸叫频率并利用陷波器抑制相应频率的增益使得扩声系统成为一个稳定的闭环系统;而反馈声消除通过估计反馈声信号并在传声器端相减,使系统成为一个开环系统。本文在啸叫频率检测、自适应反馈声消除、自适应陷波器以及去混响方面的研究成果如下:  (1)针对传统啸叫检测算法易受语音谐波干扰,产生大量虚警的缺点,提出一种基于倒谱预处理的啸叫检测算法。研究表明:与啸叫信号类似的单频信号倒谱系数峰值较小,而语音谐波信号倒谱系数有明显的倒谱峰值结构。通过抑制此倒谱峰值,降低传声器信号中的语音谐波成分,从而提高啸叫检测算法的检测概率。实验结果表明,基于倒谱预处理的啸叫检测算法能够减少系统中啸叫检测算法的虚警概率,从而降低了扩声系统语音信号失真。  (2)针对闭环系统反馈路径辨识中参考信号与干扰信号具有强相关性,使得反馈路径辨识结果出现较大偏差的问题,提出了一种利用倒谱预处理技术的自适应反馈路径辨识算法。倒谱预处理技术能够抑制传声器信号中语音谐波信号,从而显著降低参考信号与干扰信号的相关性,减小系统辨识偏差。实验结果表明,本文提出的基于倒谱预处理的自适应反馈路径辨识算法具有更小的辨识偏差,从而提高自适应反馈声消除算法性能。  (3)针对线性预测(Linear Prediction,LP)自适应陷波算法以及间接梯度下降(Indirect Plain Gradient,IPG)自适应陷波算法的优缺点,提出了一种两步优化的自适应陷波算法。理论分析结果表明:在远离最优值时,LP算法的收敛速度总是大于IPG算法的收敛速度,而在靠近最优值时,IPG算法的收敛速度总是大于LP算法的收敛速度;同时在自适应算法收敛后,IPG算法的收敛值偏差以及均方差均要小于LP算法收敛值的偏差以及均方差。两步优化的自适应陷波算法实时估计与最优值的距离,在远离最优值时算法采用LP自适应算法收敛路径,在靠近最优值时采用IPG自适应算法收敛路径。实验结果表明两步优化的自适应陷波算法具有更快的收敛速度,同时能够保持较小的收敛值偏差以及均方差。  (4)针对晚期混响问题,在LP残差域,提出了一种基于广义特征值分解(Generalized Singular Value Decomposition,GSVD)的最优滤波语音去混响以及降噪算法。计算了听觉掩蔽曲线在LP残差域对应的广义特征值,推导了基于人耳听觉掩蔽效应约束的最优滤波器方程。在降低混响以及噪声的同时,提高了传声器信号的语音质量。仿真与实验结果表明,本文提出的LP残差域基于GSVD的带人耳听觉掩蔽效应约束的最优滤波语音去混响以及降噪算法能够提高传声器信号的段信噪比、降低语音信号的对数频谱距离,减少语音失真,提高传声器语音信号的主观质量。
其他文献
强干扰背景下的目标检测问题一直是水声领域中的研究热点之一。拖曳线列阵具有孔径不受舰艇限制、可充分利用水文条件、可变深、远离拖船等优点,成为水下目标检测的重要工具。
本文采用过程神经网络算法,针对移动通信客户流失分析的应用需求和数据特点,设计并实现了基于过程神经网络的移动通信客户流失分析原型系统,具体工作包括: 1.提出过程神经网络
学位
微波成像变化检测技术通过比较同一区域不同时刻的微波图像变化情况来获取有效信息,具有全天时、全天候的高分辨率检测能力,是合成孔径雷达(Synthetic Aperture Radar, SAR)的
小麦是一种在世界上广泛种植的粮食作物,对人类粮食供应起着至关重要的作用。然而,由于赤霉病的危害,小麦产量往往会受到严重影响。小麦赤霉病(Fusarium Head Blight,FHB)是由禾谷镰刀菌引起的真菌病害,给我国南方麦区,特别是长江中下游地区的小麦生产带来了很大损失。小麦感染赤霉病后,不仅使产量和品质下降,而且由于病菌的代谢产物中含有毒素,人畜食用后还会中毒,危害人、畜健康。采用传统的小
口语对话系统是当前人机交互领域的一个重要的研究课题。该文研究如何建立对话系统中统一的知识表示模型和如何建立通用的口语对话系统的方法,使口语对话系统的开发更加规范化
在多载波QAM调制技术的环境下,同步技术是一个研究难点.本文介绍了多载波QAM调制技术的环境下同步技术的实现方案及硬件实现方法.提出了采用最大功率法估计信道的时间延迟;利
本文通过对荣华二采区10
期刊
本文研究声波在分形界面的散射和分形维数的估计问题。许多实验数据表明,水声信号在某种程度上表现出分形的非线性特征,基于该特征量的目标识别、分类和检测,以及海洋底质的反演
本文在深入研究国外相关研究成果的基础上,提出了一种有效的XML数据发布的实现方法,主要包括设计了一种基于XML模式的发布视图定义“语言”和发布视图的优化机制、执行机制,并实