基于听觉掩蔽效应的小波包语音增强方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiaochouyu005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的进步,各种计算机语音应用系统与通信技术飞速发展。许多性能优良的语音系统使用了语音增强技术。语音增强的目的是消除背景噪声的影响,改善语音质量,提高人们间的通话的清晰度,提高各种后续语音处理系统的运行效果等。随着小波分析的提出,在时频小波域进行的语音增强成为人们的研究热点之一。随着对小波分析研究的展开,人们提出了在语音处理领域有重要作用的听觉小波包分解方法,为语音增强方法开辟了一片令人期待的新领域。鉴于人耳听觉特性与最小值统计方法在频域语音增强方法中运用已经取得的良好效果,本文将在小波域中对这些方法的基本原理进行研究并将这些方法修改应用于时频小波域的语音增强处理中。本文系统研究了基于各种听觉感知特性的小波时频域语音增强算法,主要研究工作如下:1.分析了听觉小波包分解在语音增强中的应用。本文介绍的单通道语音信号的听觉小波包分解方法,依据现实中人耳存在临界带的特性,把语音信号分解到各个与临界带对应的听觉小波子带当中,便于进一步的去噪处理。2.给出了在小波域运用最小值统计方法进行小波阈值估计的方法。此方法利用修改的最小值统计方法在各个听觉小波子带中动态跟踪估计出噪声能量,并根据此噪声能量计算小波阈值。实验表明,本文的阈值估计算法能够在有色时变噪声环境下,动态跟踪噪声能量并设置阈值,为后续的小波阈值函数去噪方法提供有效保证。3.提出了基于人耳听觉掩蔽效应的阈值函数方法。根据不同频率间的信号会出现掩蔽,影响人耳的听觉阀值这一特性,构造一种能够根据当前语音信号在各个频率段的分布而产生的掩蔽阈值,动态调节函数参数以控制抑制噪声的强度的阈值函数。实验表明,本文方法可以达到良好的背景噪声抑制与产生较小的处理失真,取得了较好的增强效果。
其他文献
我国面临着严重的资源型缺水和水质型缺水问题,特别在华北地区集约化种植业灌区,农业用水的快速增长与供水日渐紧缺的现实之间矛盾日渐突出,甚至激化。与此同时,我国规模化畜禽养
近日,南非艺术家威廉姆·肯特里奇于2012年创作的装置作品《拒绝时间》(The Refusal of Time )被美国大都会艺术博物馆(The Metropolitan Museum of Art)和旧金山现代艺术博物馆(San Francisco Museum of Modern Art,SFMOMA) 共同收藏。在2009年被《时代》杂志评选为“世界最具影响力的100人”的威廉姆·肯特里奇,
本论文在研究磁性存储介质上数据存储原理和各种文件系统的基础上,从三个方面作了深入的研究。一是计算机磁盘数据的完整性检测研究,利用THUNK技术在用户模式下直接读写磁盘数
全球定位系统GPS是英文Navigation Satellite Timing and Ranging/Global Position System的字头缩写词NAVSTAR/GPS的简称。它的含义是利用导航卫星进行测时和测距,GPS是当前
随着旅游业服务信息化、网络化、个性化的发展,结合嵌入式系统技术、无线通信技术和信号处理技术的电子导游产品应运而生,并成为了当前旅游业发展技术中的研究热点。通过无线
通过野外测坑定位试验和大田小区实验,分别研究了有机肥处理(OT)、混施肥处理(MT)和化肥处理(CT)3种不同施磷处理和低磷处理(P1)、常磷处理(P2)、高磷处理(P3)和超高磷处理(P4
摘 要:在设计基础的教学中,培养和锻炼学生的设计思维能力,应从情感出发。通过学生对于自己熟识的事物和生活,表达自己的情绪,创造性的完成设计。在情感化的教学模式中,避免僵化、教条的构成规律知识的讲授。从学生们熟悉的自然事物,周遭的生活出发,寻求设计作品的主题。学生在设计形式上可以不用拘泥于哪一种特定的构成形式,鼓励学生有目的的为了自己作品的表现力度,将三大构成结合起来运用,鼓励学生创新,鼓励学生个性
多铁材料是一种电、磁和结构序相互耦合的材料,它同时具有两种或者三种“铁性体”的性质:铁电性,铁磁性和铁弹性。其中,BiFeO3是少数具有高居里温度(Tc~1103 K)和高尼尔温度(TN~6
本文介绍了一种基于DSP的无刷直流电动机控制系统,在全面分析研究了无刷直流电动机运行方式的基础上阐述了实现该控制系统的硬件设计方案及控制策略。系统采用高性能TMS320C24
重金属和多环芳烃是城市区域中最典型的两类持久性有毒污染物,普遍存在于城市大气、水体和土壤环境中。重金属和多环芳烃会吸附到土壤颗粒中并在土壤中存留很长时间。不同于易