基于稀疏表示和深度学习的单通道语音信号分离技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:atianjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
盲源分离是指在信源特性和混合过程均未知或部分未知的情况下,仅根据源信号的某些先验特性,从观测信号(也被称为混合信号)中恢复出源信号的过程。当观测信号仅有一路时称之为单通道盲源分离。目前,基于稀疏表示的单通道盲源分离算法取得了一定的研究成果,但仍然存在一些不足。基于稀疏表示求解该问题涉及到了冗余字典构造和优化算法的运用,具有极高的理论意义,同时,单通道盲源分离广泛应用于现实生活中,对该问题的研究具有很大的实用价值。本文深入研究了语音信号稀疏表示理论以及现有的基于稀疏表示的单通道语音信号分离算法。在此基础上,分析了“交叉投影”问题产生的原因,提出了含公共子字典的联合字典构造方法,给出了基于该联合字典的混合语音分离算法。文章尝试了把深度学习技术引入到盲源分离问题当中,实现了基于深度神经网络的异性说话人双输出混合语音分离模型,取得了较好的分离效果。本文的主要研究内容和创新成果包括:(1)介绍了信号的稀疏表示理论,阐述了基于稀疏表示理论的单通道盲源分离算法的基本原理,详述了语音信号预处理的步骤,介绍了了衡量语音信号分离的评价指标。在这个基础上,文章进行了实验仿真,实现了基于稀疏表示的异性说话人混合语音分离。(2)提出了基于含公共子字典的联合字典的单通道盲源分离方法。文章对传统的基于稀疏表示的单通道盲源分离方法存在的“交叉投影”问题进行了探索性的研究,从理论和实验上验证了由于字典训练集之间存在相似成分,导致联合字典区分性较差,影响了分离效果。基于这一结论,文章提出了含公共子字典的联合字典构造方法,通过引入公共子字典使得源信号中相似的成分投影到公共子字典上,同时减小了字典间的干扰,克服了“交叉投影”问题。文章给出了基于含公共子字典的联合字典求解单通道盲源分离问题的详细算法。最后,进行了实验仿真,验证了这一新方法的有效性,并对实验结果的影响因素进行了分析。(3)提出了基于深度学习的异性说话人混合信号分离模型。为了进一步提高分离信号的质量,文章使用了当前非常热门的在语音信号处理领域应用很广泛的深度学习技术。系统的介绍了深度神经网络的理论知识,包括深度神经网络结构、网络的训练算法。搭建了基于深度神经网络的异性说话人双输出混合语音分离模型。通过实验验证了这一模型的有效性,并对实验结果影响因素进行了分析。
其他文献
目的:评价化学药品一类新药苯胺洛芬注射液的镇痛作用。方法:通过甲醛、热水、热板、电刺激致小鼠疼痛模型来评价苯胺洛芬注射液的镇痛作用,并选用了氟比洛芬酯注射液和喷他佐辛
目前的高等教育收费加重了农民的经济负担并影响到教育的公平性和部分贫困农村家庭的正常生活。结合农村家庭高等教育支出的相关调查数据,利用恩格尔系数-收入法和收费成本比
本文结合作者的教学实践,从重点突出、值得思考、有所依据以及要有预案性四个方面着手,重点阐述设置问题的重要性。课堂上,教师所设置的问题,不仅要激发学生的求知欲,而且更
<正>半个多世纪以前,社会学家费孝通先生出版了一本代表性著作《乡土中国》,开篇即说:"从基层上看去,中国社会是乡土性的。"1随后他又说:"乡土中国,并不是具体的中国社会的素
利用河蟹壳制备壳聚糖的改进工艺,对脱乙酰度、粘均分子量2项主要指标进行测定。经过极差分析找到了最佳工艺条件,即浓度为15%的氢氧化钠100℃脱蛋白1h,浓度为15%的盐酸25℃
钳工实训中常见的轴类零件上加工方孔,孔之间有较高的位置精度,操作起来难度较大,不易掌握。通过对工件的加工难点工艺进行分析,对技术难点进行了分解,使复杂的问题简单化,逐
目的 探讨急诊重度骨盆骨折合并失血性休克介入术的护理对策。方法 40例重度骨盆骨折患者,随机分为观察组和对照组,各20例,分别给予特定系统化护理和常规临床护理。将两组术
渤海与大氏的由来及其文化内涵,是一个争论颇多的学术问 题,为了解决这一问题,应该坚持最可靠、最必需、最重要的基本历史联系,方可认识到渤 海因大氏而得名,大氏乃古大氏族团后裔
由于农村耕地的缺乏、农业比较效益低,随着城市第二、三产业的发展,越来越多的农民跳出农业,从农村转移到城市,形成近几年备受关注的“打工经济”。在农民工对城市建设做出巨
07物流团队结合专业仅对中百集团旗下的武汉中百物流配送有限公司(以下简称中百物流)进行了调研,归纳起来,我们认为,该公司与同类型其它企业相比较具有"三大优势"即资源优势