论文部分内容阅读
语音增强技术目前已成为语音信号处理的一个重要分支,其目的是从带噪语音信号中尽可能地提取纯净的原始语音信号,抑制背景噪声,提高语音的清晰度和主观听觉舒适度。该技术目前已经广泛应用于无线通信、电话会议、场景录音和军事通信等领域。近年来出现了多种语音增强方法,其最终目的都是希望在去噪度、语音畸变度以及“音乐噪声”之间取得良好的折衷。但是由于语音信号背景的不同,环境噪声的多样性,这一问题并没有完全得到解决,针对不同的背景噪声通常需要不同的增强方法。再者,目前大多数语音增强算法并没有利用到语音和噪声本身的一些特征参数,没有利用到一些智能处理方法(如神经网络和粗糙集理论)来估计和跟踪噪声的变化。鉴于此,本文提出了一种基于粗糙集理论的语音增强方法,主要工作体现在:(1)系统地介绍了目前常见的语音增强方法,其中重点讨论了谱减法、带参数谱减法和听觉掩蔽原理,并用Matlab进行了一系列仿真实验,通过实验结果主客观分析,比较了它们的性能和增强效果,讨论其优缺点。(2)在上述分析工作的基础上,提出了将粗糙集理论中的一些数据处理方法应用到语音增强当中。例如:①提取噪声和带噪语音的两组特征参数即谱平均值N? k和频谱平坦度测度(SFM)来构造决策表,划分条件属性和决策属性;②采用自组织特征映射法(SOFM )将连续的条件属性值离散化处理,然后对决策表进行约简、训练和规则提取,估计和跟踪噪声的变化。其主要作用是将带噪语音频谱分为语音谱和噪声谱,再结合听觉掩蔽语音增强方法,能更准确地将带噪声语音中的一些“无用”噪声成分掩蔽掉。(3)采用了一种综合客观语音质量评价方法对不同信噪比、不同背景噪声条件下的带噪语音,分别用谱减法、带参数谱减法、听觉掩蔽法和本文改进法增强后的语音质量进行了客观综合评分。通过实验测评的分数可以看出,本文提出的基于粗糙集理论的语音增强方法在不同信噪比及不同背景噪声条件下都是适用的,尤其在低信噪比条件下比其它几种方法更具有优势。