基于稀疏度量的多级FrFT语音增强算法研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:wangxinyi808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,语音就是人与人之间日常交流的主要载体。随着现代计算机技术和人工智能技术的快速发展,语音逐渐成为人机交互的重要形式。但是周围环境的噪声一直干扰语音信号,语音的质量和可懂度大大降低,严重影响人们的生活质量和人机交互质量。语音增强技术的本质就是采取某种算法尽可能地消除语音中的噪声,提高语音的清晰度和可懂度。传统的语音增强算法在平稳噪声环境中具有良好的去噪效果,但是在非平稳噪声环境中,这些传统方法的去噪效果并不明显,甚至在去除噪声的同时削弱语音的质量,使得语音严重失真。本文分析了传统变换域语音增强算法,发现在非平稳噪声环境下,传统变换域中重叠的语音信号和噪声无法完全分离的问题,基于此本文提出了基于稀疏度的多级分数阶傅里叶变换(Fractional Fourier Transform,FrFT)语音增强算法,主要研究内容和创新点有:(1)分数阶变换域稀疏度量研究。研究了语音信号和噪声在分数阶傅里叶变换域的能量分布,发现语音信号在分数阶域具有较强的能量聚集性。充分研究传统的变换阶数确定方法,即最小均方误差法和最大信噪比法,这些方法计算量较大,不适于实际应用。基于语音信号在分数阶域的稀疏特性,提出了根据稀疏度确定最优变换阶数的新方法,并将稀疏度法与加权方差法作比较,结果表明本文的稀疏度确定最优阶数的方法运算速度更快,计算结果更准确有效。(2)多级FrFT语音增强算法研究。研究了非平稳环境下,传统变换域方法无法将语音和噪声完全分离的问题后,本文提出了基于稀疏度量的多级FrFT语音增强算法。首先采用稀疏度量方法计算各级最优变换阶数,对含噪语音信号作多级分数阶傅里叶变换。然后采用最小均方误差法计算每个分数阶域的滤波器频率响应,并给定一个阈值,不断迭代优化确定最优的分数阶域滤波器频率响应。最后根据确定的最优分数阶域滤波器频率响应在不同的分数阶域对含噪语音信号进行去噪处理得到增强语音信号。通过实验验证,本文算法可有效地去除噪声,减少失真,信噪比也有较大的提升。(3)本文采用客观评价方法中的信噪比,对数谱失真测度和语音质量感知评价(Perceptual Evaluation of Speech Quality,PESQ)评价语音增强质量,并将本文算法与几种传统算法进行对比。实验结果表明,本文基于稀疏度的多级FrFT语音增强算法具有良好的去噪效果,可较大幅度的提高信噪比,且优于其他几种算法。
其他文献
随着人工智能、人机交互、模式识别等技术的快速发展,情绪识别已经成为了该领域研究的一个热点。传统的情绪识别研究多采用语音特征、面部表情图像特征进行识别,但这些情绪的
复杂背景,即存在遮挡、光照、模糊以及人脸不同姿态等干扰因素的背景。复杂背景中的干扰因素会导致人脸的特征变得不准确,使得复杂背景下的人脸检测研究变得十分困难。目前,
液压系统的同步控制在重型、大型构件或设备的生产、安装和搬运等场合中的应用是十分广泛的,本文以16000t海上浮托安装平台为对象来进行液压系统同步控制的研究。在该液压系
疲劳失效是重要零部件的常见失效形式之一。表层改性是抗疲劳制造中的关键技术环节,其目的是通过外界能量的转换,在零件表层形成具有一定深度和幅值的残余应力场,从而有效提
无人系统在人类生活中发挥着越来越重要的作用,无人系统上搭载的各类传感器是无人系统获取外界信息的主要途径,如何管理、协调各类传感器是提高无人系统工作效率和鲁棒性的关
随着现代工业的不断发展,高值工业装备的需求量越来越大,通过表面处理延长其疲劳寿命进而达到降低生产成本目的,是所有相关研究者一直以来的研究目标。构件经表面处理后塑性
当前外骨骼助力设备研究蓬勃发展,在解决老年人行动困难、辅助高强度劳动与增强军事单兵作战方面具有广阔运用前景。通常在外骨骼上使用电机直驱或串联弹簧执行器形式对人体
体育赛事作为传播体育文化的重要途径,越来越多的体育赛事通过品牌建设来获得广大公众的关注和认可,更多的公众因关于品牌体育赛事而关注到体育文化。“李广杯”国际传统射箭
图像中的信息有很大一部分蕴含在图像的梯度之中,比如图像的纹理、噪点等等。很多图像的优化问题都与图像的梯度有关,例如尽可能沿着图像较大梯度方向而进行的M-S模型图像分
聚类分析的目标是在没有先验知识的情况下把数据集分成若干个簇,使得簇内的数据之间的相似度较高而不同簇之间的数据相似度较低,比如用户可能并不知道数据集分类的数目或数据