论文部分内容阅读
随着通信技术和多媒体技术的日益发展,语音信号成为人机交互过程中的重要工具,更是人们日常生活中不可替代的交流模式。但是由于环境的多变性和复杂性,人们往往不能得到纯净的语音信号,通常包含背景噪声和混响成分,背景噪声和混响的存在影响了人们的听觉感受。当干扰信号淹没纯净语音信号时,人耳就无法分辨语音的真实含义,严重影响到人们的日程生活。因此,必须通过语音增强技术对接收到的语音信号降噪和去混响处理,以此来改善语音的质量,提高语音的可懂度。室内语音信号传感器接收到的观测信号中常常含有背景噪声和混响,为了从观测信号中分离、提取出高质量的语音信号,本文首先采用多窗谱估计的改进法去除背景噪声。在分离过程中针对语音信号源数与传感器数目的关系,分别选取不同的算法进行盲源分离。但分离出的语音信号还存在混响成分的影响,因此,还需对分离出的语音信号进行分析,以便找到更合适、更有效的语音增强后处理方法。本论文的主要工作包括以下几个部分:室内环境下,由于环境噪声以及墙壁对声音信号的反射,语音信号传感器接收到的信号是带有噪声和混响的混合信号。在对观测信号进行分离之前,必须要提高分离信号的信噪比。本文采用多窗谱估计的改进法作为预处理过程,首先对观测信号消噪,使其具有更高的信噪比,以满足盲源分离的基本要求。实际环境中的盲分离问题通常是卷积混合模型,然而卷积问题可以转化为频域中的线性问题,因此,本文只讨论了线性瞬时混合条件下的盲源分离。本文首先介绍了独立分量分析(ICA)、快速独立成分分析(FastICA)、主成分分析(PCA)、稀疏成分分析(SCA)以及拓展四阶累积量矩阵法估计语音信号源数,从而根据语音信号源数与传感器数的关系将盲源分离分为三种类型:正定盲源分离,超定盲源分离,欠定盲源分离。根据这三种类型提出了自适应盲源分离算法,并进行仿真实验。分离出的语音信号还存在混响成分,需要进行后处理去混响。本文介绍了混响的相关知识以及复倒谱的概念、性质。根据房间冲激响应和纯净语音信号在复倒谱域的分布范围不同,文中采用了复倒谱域法进行去混响,并通过实验仿真验证了该算法的可行性。