基于稀疏分解的单通道混合语音分离算法研究

来源 :南京邮电大学 | 被引量 : 14次 | 上传用户:ccbeilu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单通道混合语音分离是语音分离研究的重要方向,稀疏分解理论的发展为解决单通道混合语音分离问题提供了新的思路。正因为如此,本论文主要研究基于稀疏分解的单通道混合语音分离算法。借鉴稀疏分解和随之发展起来的压缩感知的理论成果,通过字典学习,构造合适的与源语音信号自适应的基或字典,在此基础上,采用l0 -范数优化算法,设计有效的基于稀疏分解的单通道混合语音分离算法和基于压缩感知的单通道混合语音分离算法,以达到增强目标语音,抑制干扰语音的目的。本论文的主要工作和创新如下:①从探讨如何构造与源语音信号自适应的基或字典出发,提出通过对角化源语音信号自相关矩阵,构造理想准KLT基,并从理论上证明,任何信号在理想准KLT基下都具有稀疏性。鉴于在实际情况下,不一定能获得确切的理想准KLT基,提出通过选取合适的模板和计算相应的模板匹配系数,来近似语音信号的自相关矩阵,再对近似的自相关矩阵进行特征值分解,构造两种实用的模板匹配准KLT基—非齐次线性均方估计模板匹配准KLT基和正交匹配追踪模板匹配准KLT基。仿真表明,浊音信号在模板匹配准KLT基下的特性与在理想准KLT基下的特性相近。②以创新点①为基础,研究基于准KLT基的单通道混合语音分离。a从理论上证明,当基函数满足一定的条件时,采用l0 -范数优化算法,可以实现单通道混合语音的完美分离,并进一步证明理想准KLT基满足该条件b由于实际语音分离时,源信号未知,故无法获得理想准KLT基,提出对上述两种模板匹配准KLT基构造方法进行改进,以混合语音信号为已知条件,来构造各源语音信号的模板匹配准KLT基。在此基础上,提出了两种实用的基于模板匹配准KLT基的单通道混合语音分离算法—基于非齐次线性均方估计模板匹配准KLT基的分离算法和基于正交匹配追踪模板匹配准KLT基的分离算法。仿真表明,该算法的性能优于现有的基于独立成分分析基的分离算法和采用形分析技术改进后的计算机场景分析算法。③论文将压缩感知和单通道混合语音分离相联系,研究基于压缩感知的单通道混合语音分离。a从压缩感知的视角看待单通道混合语音分离问题,设计基于压缩感知和K-SVD的单通道混合语音分离算法。仿真表明,该算法对各类混合语音的分离效果相差不大,性能稳定。b在DCT域设计基于能量特性的帧间帧内自适应语音压缩感知观测构造算法,以进一步减少基于压缩感知的源语音信号的“采样率”,为研究基于压缩感知观测特性的单通道混合语音分离奠定基础。仿真表明,该算法的性能优于贝叶斯压缩感知算法的性能。
其他文献
目的探讨落实细节管理对改善口腔精细小器械(下文简称为“器械”)清洗质量的效果。方法选取2018年6月~9月未实施细节管理的器械1000件作为对照组,另选取2018年10月~12月实施
农村、农业、农民关系到我国社会的稳定、国家富足和民族复兴。当前转变我国农业经济发展模式,大力发展现代化农业是实现我国经济跨越的必经之路。将电子商务作为农村精准扶贫的重要抓手和重要手段,又是党中央国务院的重要决策。习近平总书记在2013年时就曾针对农村贫困状况提出要“实事求是、因地制宜、分类指导、精准扶贫”,为解决农村的贫困现状,把精准扶贫作为一个长期工作来抓。近几年来,国家扶贫办、财政部、商务部以
宁波市着力推动职业教育校企合作,强化“四项驱动”,推动“四项对接”,创新“四项模式”,形成了政府推进、学校跟进的良好格局。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在中国现当代文学中,“颓废”一直是一个备受争议的词语,很少有作家心甘情愿被扣上颓废主义者的帽子。“颓废”一词虽是从西方传入中国的,但其内涵意义的历史,范围却远比词语
12月10日,在浙江广厦召开的临时股东大会上,因担任配股主承销商而成为第二大股东的平安证券有限责任公司,有俩人进入董事会,1人进入监事会,其中1人出任浙江广厦副董事长。因配股“
报纸
18世纪上半叶,宾夕法尼亚等许多北美英属殖民地政府,相继通过发行纸币成功地解决了经济发展过程中出现的货币供应不足问题.北美殖民地发行纸币实践所体现的理论意义,至今仍然
本发明涉及一种丁腈橡胶选择性非均相溶液加氢催化剂的制备和使用方法。该方法包括以下步骤:以二氧化硅为载体,采用多种不同功能硅烷偶联剂分别修饰载体后负载贵金属颗粒,制
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
线阵三维SAR作为一种新型的三维雷达成像技术,在高精度测绘与资源调查、自然灾害监测与侦察预警等民用和军用领域都有广泛及重要的应用价值。受限于传统Nyquist采样定理和经