基于联合字典学习和稀疏表示的语音降噪算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lwt159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类最便捷和自然的交流工具之 ,一方面它消除了人与人之间交流的距离隔阂,另一方面它也提高了人与机器之间交互的效率。然而,现实环境中无处不在的噪声也不同程度地影响着语音交流的质量,研究有效的语音降噪技术就显得尤为重要,也是近几十年来学者们研究的热点。语音降噪是指在不显著丢失语音成分的前提下尽可能地削弱噪声,以实现提高语音的质量和可懂度这两个目标。而现实环境中的非平稳噪声及与人类语音类似的噪声则极大地提高了语音降噪的难度,传统的语音降噪算法此时往往不再适用。近年来,随着字典学习和稀疏表示理论研究的不断深入,给语音降噪问题提供了一种有效的解决途径。分别提取最能表征干净语音和噪声的特征并构造成字典,从而通过带噪语音在字典上的稀疏表示恢复出干净语音。不同于现有的基于字典学习和稀疏表示的语音降噪算法,本文针对有监督和半监督两种情况下的单通道语音降噪任务,进一步地挖掘信号之间存在的区别与联系信息对于字典学习和稀疏表示所起的作用。以这些信号间的关系作为主线,下面介绍本论文的主要工作和创新点。首先,提出了Fisher准则约束下基于区分性联合字典学习的有监督语音降噪算法。在字典学习阶段强调干净语音与噪声之间的区别关系,一方面添加字典区分性保真项,使语音字典和噪声字典之间的相关性最小;另一方面根据稀疏表示系数分布的差异性添加Fisher约束项,使干净语音和噪声各自的稀疏表示系数类内距离更小,类间距离更大,增大了稀疏表示系数的区分性。其次,提出了基于互补联合字典学习和稀疏表示的有监督语音降噪算法。在字典学习阶段强调带噪语音与干净语音、带噪语音和噪声之间的联系关系,用以约束联合字典的学习,使得字典原子级上映射关系的线性组合能表征信号间的联系关系,缓解源混淆和源失真问题。在降噪阶段中强调干净语音和噪声在稀疏表示效果上的互补关系,考虑信号结构特性与输入信噪比因素设置了两路稀疏表示的权重系数。最后,提出了基于区分性稀疏约束下非负矩阵分解的半监督语音降噪算法。在降噪阶段利用带噪语音学习噪声字典的过程中强调了噪声与干净语音的区别关系,添加噪声字典与已知语音字典的区分性约束项,并给出了相应的字典与稀疏表示系数更新方法。
其他文献
立体图像技术是图像领域内重要的研究方向之一,立体图像技术在科学技术研究、军事、教育、医疗等诸多领域有着广阔的应用前景。使用立体摄像机或者深度摄像机,可以还原场景的
IC晶片图像检测包括特征尺寸测量、缺陷检测(DI)以及目检(VI),依靠人眼加放大镜的检测方式受到很大挑战且存在很多不足之处,已经不能满足现代工业生产要求。本文针对IC晶片图
轴类零件尺寸的测量是轴类零件制造业的重要环节,随着制造技术的不断发展,传统的测量方法已经不能满足生产的需要。就目前国内许多制造业对零件的尺寸检测而言,其检测工作还
弹上信息传输是地面与高速运动目标进行通信的系统,对保密抗干扰、通信的实时性、通信的质量有着严格要求,并存在严重的多普勒调制,广泛用于航天、航空、导弹等领域。本文根
宽带数字接收机是高精度宽带雷达接收系统的重要部分。本文针对宽带雷达信号的诸多优点,利用软件无线电中信道化接收的概念,实现全波段的宽带数字接收机,为宽带信号数字化技术发
本文是对基于无人机图像传输的π/4-DQPSK的全数字调制解调技术的研究,利用π/4-DQPSK数字调制和基带差分解调技术实现数字信号的传输。π/4-DQPSK是QPSK改进方式,它是一种线
本文介绍了国内外扭振检测技术的发展与现状,在此基础上分析了一种用软件实现轴系扭振检测的方法,该方法是基于希尔伯特变换解调原理。扭振检测模块的设计以DSP处理器为核心,
随着网络技术的不断发展,越来越多的人们希望通过网络寻找到他们感兴趣的东西,如音乐、图片等。人们的这种需求对多媒体检索提出了新的要求。音乐检索是继图像检索之后在基于
由于毫米波具有较好的穿透性,利用被动毫米波成像技术对隐藏在衣物下的危险物品(枪支、刀具、炸药等)进行识别、定位成为安检领域的又一研究热点。但是目前毫米波图像存在着
手语是聋哑人日常生活的主要语言,同时也是他们和正常人交流的主要方式之一。而大多数正常人并未经过专业的手语培训,使得聋哑人无法同其进行无障碍地交流。为了解决这个问题