基于稀疏表示的语音增强算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhangrong825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际的语音通信系统中,语音信号不可避免地要受到噪声信号的干扰。噪声的存在严重的导致了语音质量的降低,并影响人们对语音信息的辨识能力。为了改善语音信息质量,从含噪语音中获取尽可能的纯净的语音,就需要语音增强。语音增强是消除噪声干扰、解决噪声污染的一种有效的方法,其首要目标是尽可能的从背景噪声中提取出纯净的语音信号,以达到改善语音信号的质量和可懂度的目的。从当今国内外的研究发展成果来看,一些语音增强的方法可以降低背景噪声,改进语音质量,但仍会使非语音段遗留较多噪声,并存在产生特定噪声和语音畸变等问题,从而造成增强后的语音与原纯净语音相差较大。为了解决上述问题,本文结合语音增强与稀疏表示理论,提出了一种新型的基于DCT正交基稀疏表示的自适应谱减法。该算法中语音的重构需依据环境的噪声大小和特点选择一定的DCT矢量表示纯净语音,为了自适应选择合适的矢量,本文提出一种稀疏软阈值解决该自适应的问题。算法思想具体如下:首先,在训练阶段,通过VAD技术估计非语音段的噪声方差,将其作为初始稀疏阈值输入到双族群果蝇优化算法中估算出全局最优稀疏软阈值。其中,双族群果蝇优化算法是一种改进的果蝇优化算法,该算法有效地弥补了后者易收敛到局部极值等缺陷。其次,在语音重构阶段利用最优稀疏软阈值控制重构算法在迭代过程中对DCT系数矢量的选择,即选择适当的矢量表示纯净语音,从而达到压缩甚至过滤噪声的目的。其中,为了缩小重构语音与原纯净语音之间的误差,提出一种广义A*OMP算法作为重构算法,该算法相比A*OMP算法在语音重构精度和速度方面有很大提升,重构精度与BP算法相当。最后,由于DCT系数矢量的选择并非是最优的,故重构后的语音仍会残留少量噪声,为了进一步压缩被重构的噪声,则对重构语音进行噪声谱减。通过高斯白噪声情况和有色噪声情况的实验数据证明:在低信噪比环境下,本文提出的算法能有效地过滤了非语音段的噪声,压缩了语音段噪声,从而提高了语音质量和可懂度。
其他文献
随着服务计算理论与技术的发展,单个Web服务往往因为服务颗粒度的限制而不能很好地满足用户复杂的业务需求,因此这势必会要求Web服务组合及相关技术的出现。而Web服务的真正潜
随着高速铁路的飞速发展,高速铁路的安全与舒适成为当前研究的一个热点问题。安装在列车上的传感器采集的噪声数据反映了列车的运行状况,并与列车的安全息息相关。然而在噪声
Deep Web深度网络资源,又称作不可见网或隐藏网(译为Invisible Web or Hidden Web),它常常被人称为谷歌查不到的网络信息,这些信息不属于我们所熟知的那些标准搜索引擎所能够
信息技术的持续快速发展带来了对数据存储及作用在数据集上计算的空前要求,科研机构、政府以及企业都面临着海量数据存储成本高、数据管理困难、计算复杂度高、容错率低等难
入侵检测系统(Intrusion Detection Systems, IDS)被定义为对恶意行为进行分析和处理的系统,保护对象是计算机和网络的资源。在入侵检测系统中,模式匹配算法属于核心技术之一
人机交互(Human-Computer Interaction,HCI)作为计算机研究分支之一,越来越受到人们的重视。尤其是随着移动计算设备的增加以及计算机性能的提升,传统的人机交互方式显得的越来越
随着用电信息采集系统的普及,电网公司和电力终端用户之间的交互将迅猛发展,电力公司会每隔一定时间采集用户的用电信息,用户可以实时获取或报告自己现在或将来一段时间内的用电
近些年,随着智能移动设备大规模的推广以及移动无线网络技术的快速发展,数据流量激增所带来的移动频谱匮乏、基站通信压力过大的问题日益凸显。传统的蜂窝网络系统已经逐渐无法
差分进化算法(Differential Evolution Algorithm,DE)是一种基于种群个体差异、主要解决连续性优化问题的启发式随机搜索算法。自1995年R.Storn和K.Price为求解Chebyshev多项
随着网络主机和应用数目的增长,如何在大规模网络中识别异常流量越来越具有挑战性。目前,国内外已有许多成熟的基于主机的异常流量分析方法,重点以分析网络中的特定节点为主