欠定卷积混合语音信号盲分离研究

被引量 : 0次 | 上传用户:chinajovi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音信号处理领域中,将各个语音源信号从多个说话者的混合语音信号中分离出来,成为一个研究热点和难点,语音信号处理中的重要的研究方向,对语音识别、语音增强等都有着非常积极的作用。盲源分离(Blind source separation,BSS),指的是在源信号和传输信道参数未知时,仅由观测到的信号求出源信号的过程。在现今大多数的研究中,语音盲分离算法严格要求观测信号的数目大于或等于源信号的数目。然而,在实际情况中,经常会出现欠定情况,即观测信号的数目会小于源信号的数目的情况。在实际情况中还必须考虑到环境因素对信号传播的影响,会产生延迟效应,用数学的表示方法便是卷积的形式。因此,寻找高效的欠定卷积混合语音盲分离的方法具有非常重大的实际意义和价值。本论文针对欠定卷积混合语音的盲分离方法进行了研究:(1)基于快速独立分量分析和自适应非线性二元时频掩蔽的语音盲分离方法。对输入的混合语音信号进行快速独立分量分析,将结果进行自适应非线性二元时频掩蔽;重复进行这两步处理,直到分离出所有的语音源信号。将分离出的语音源信号,再通过二元时频掩蔽合并可提高输出的质量,分离出的语音信号仍然能保留双声道立体声的效果。实验表明,该方法的性能大大优于DUET方法和BLUES方法,信噪比增益大幅提高。(2)基于非负矩阵分解(NMF)的语音盲分离方法。本方法使用高斯分量对源信号的短时傅里叶变换(STFT)进行表示,高斯分量由基于板仓-斋藤(Itakura-Saito(IS))散度的非负矩阵分解的因子所组成。使用极大期望值算法(EM)求解参数,并对信号进行重组。本方法被应用到双声道立体声信号的盲分离实验,实验结果表明了该方法的有效性。(3)基于快速相对牛顿法和乘子平滑技术的语音盲分离。该方法运用语音信号的稀疏性和语音信号之间相互独立的特性,使用快速相对牛顿法,使得在牛顿法中,求海森阵的步骤大为简化,大大提高了运算速度。将乘子平滑技术运用到包含拉格朗日乘子的最大类型函数的平滑近似式中,获得了一个扩展的增广拉格朗日方法。该方法保证了在不增加问题维数的情况下平滑因子的快速收敛,取得了很好的分离效果。本文研究三种欠定卷积混合语音盲分离的方法,具有一定的理论意义和应用价值。
其他文献
桂枝气味辛温、无毒主上气咳逆,结气喉痹、吐吸、利关节、补中益气、久服通神、轻生不老。其功效:散寒解表、除痹止痛、通阳开结,温中补虚。温阳蠲饮、通络袪瘀、利肝肺气、
我国管理层收购由国有和集体中小企业逐步发展到国有大型企业,出现了很多新的形式。由于法律规范的缺失,以管理层收购的形式合法侵吞国家利益的情况时有发生,管理层收购不得
目的:建立基于TGF-β1与Bcl-2的抗干眼症中药高通量筛选体系,为干眼症防治药物的研究提供一个理想的技术平台。并利用所建立筛选体系对密蒙花小规模中药组分库进行阳性组分筛
简述了真空冻干非油炸膨化冬枣生产技术的必要性,阐述了真空冻干非油炸膨化冬枣的生产工艺流程、设备的设计、改造、创新及操作要点。
<正>在世界音乐发展中,中国民族声乐艺术经历了漫长的演唱、教学实践,特别是近百年来的实践,已形成了自己独特、多样的音乐艺术风格。作为音乐艺术表现类别之一的声乐艺术,表
水是生命之源,饮用水源的安全是公民身体健康和生产生活的根本保障,也是实现可持续发展的前提条件。近年来全国各地饮用水源污染事件频发,受害人群相当广泛,因此饮用水源安全
预算管理体系是高校管理体系的重要内容之一,其管理水平的高低直接影响到学校的财务状况,乃至对学校教育事业全面、高效、可持续发展产生重要影响。高校要在竞争激烈的教育市
本文探讨男性知识分子舒芜(1922-2009)的女权主义思想形成的基础和过程,他以男性"个中人"的身份,对中国男权社会、男权思想进行了分析揭露,表达出一位男性女权主义者对中国社
本文主要通过分析瓦西里·康定斯基的绘画理论、表现形式及发展趋势,研究这位俄国抽象主义先驱画家为何选择到德国包豪斯学校任教、包豪斯又为何会选择康定斯基的问题,并进而
带状疱疹是皮肤科常见病,常规用阿昔洛韦治疗,疗效确切,但阿昔洛韦对肾脏有一定的副作用,影响了其临床的应用范围。我们于2006年7月—2009年11月,采用薄芝糖肽注射液联合利巴