基于弹性网正则的稀疏先验多通道语音去混响

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:teruiandi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在室内和车内等声学环境密闭的地方,麦克风采集到的语音信号中会包含混响噪声。作为语音增强的一个重要组成部分,语音去混响算法可以为语音识别等技术进行预处理,去除语音信号中的混响噪声,提高语音信号的质量和可懂度。本文基于多通道线性预测(MCLP)语音去混响算法,做了如下几部分的研究:(1)分析了传统的加权预测误差(WPE)算法。传统的WPE算法是对期望的原始语音信号的短时傅里叶变换系数进行统计建模,发现其符合时变高斯模型,然后利用最大似然估计的方法求出期望语音信号。改进的算法是利用更能逼近真实语音信号的广义高斯分布先验概率模型来估计期望语音信号。本文研究改进型WPE算法发现,在利用最大似然估计法求未知参数时,对概率模型方差的估计不够准确。因此引入了非负矩阵分解方法,利用I-S散度求解非负矩阵分解优化的方差参数,从而提高了去混响效果。(2)根据原始语音信号的稀疏特性,利用稀疏重构的方法求解WPE算法中的预测滤波器系数。方法是将期望语音信号改写为稀疏表示模型,利用迭代加权最小二乘(IRLS)算法求解目标函数。本文研究了该算法的求解过程,发现如果麦克风矩阵比较紧密,会导致观测矩阵产生奇异值,降低稀疏表示模型的精度,因此本文考虑引入正则项约束原稀疏表示模型。再分析了岭回归模型和套索回归模型的优缺点后,本文采用弹性网(Elastic Network)回归模型对原目标函数进行约束。最后通过MATLAB仿真实验验证上述两种改进算法的去混响效果。利用镜像声源模型算法模拟出不同程度的房间冲激响应,与原始语音信号进行卷积得到混响语音信号,利用上述算法对混响语音信号进行去混响处理。通过评价增强语音信号的去混响效果,可以看出本文提出算法改善了原算法的去混响能力。
其他文献
自助行李托运智慧机场服务的重要组成部分,也是对旅客便捷出行的重要保障。自助行李托运系统需要对旅客放入的行李根据民航法规与承运方要求进行适运性检测,而点云能够较为直
电液位置伺服控制系统由于自身的动力密度大、负载能力强等优点,在工业生产、航空航天等各个领域中得到了广泛的应用。其中用于实现控制策略的电液伺服控制器对系统的控制性
水合物法天然气储存技术可实现在中温段(约273 K)和相对温和压力(P=3~10 MPa)的工况条件高密度储存天然气。为了解决甲烷水合物生长动力学相对缓慢的问题,以及实现更低工况压
在日常生活中,用户偏好决定着选择,用户偏好的不同导致了用户选择结果的不同,所以,在关系型数据库中对偏好查询问题的研究成为研究热点。在具体应用中,偏好可分为定量偏好和
低品位石油储量是指已探明未开发储量中资源质量差、分布特征复杂、难以有效开采的石油资源,其开发通常面临着高投资、高成本、低效益的问题。本文以辽河坳陷大民屯凹陷358区
在传统物理学理论中,声子一直都被认为是线极化的,它的角动量为零。然而近几年的研究发现,声子是可以圆极化的,是手性的,也就是具有非零角动量。最近研究者利用瞬态红外光谱
本文以钢铁全流程生产过程为背景,研究了炼钢工序合同与库存计划问题。该问题的核心决策是确定客户合同如何按时间分配到不同生产单元。但为了估算上述合同分配决策后的批量
近年来,中国已成为全球的空调生产基地,空调用截止阀市场需求在不断提高,而生产装配方式依然以人工为主,仅少数自动化程度比较高的工厂实现了部分工序的半自动化装配。由此带
大庆油田主力油层驱油结束后,聚驱驱替对象已转向渗透率更低、层间差异更大的二类油层。由于二类油层复杂的地质特征,在进行分层注聚过程中,虽然大多数油层能够注入相对分子
随着我国工农业和经济的高速发展,排入至环境介质的各类污染物逐年增长,环境质量日益下降。近年来,各类环境介质中离子型污染物(如重金属、磷、氮等)均出现远超国家相关控制