基于非负矩阵分解的语音信号盲分离算法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:heg_zcg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号的盲分离作为盲源分离技术(Blind Source Separation,BSS)的一个主要研究分支,广泛应用于语音识别、移动通信、音频编码与操作、音乐分析等技术领域,是国内外学者们研究的热点课题之一。目前,盲分离算法已经有了一定的理论基础,但在实际的研究中仍然有很大的改进空间,因此近年来许多新型的算法被相继提出,其中基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的盲分离算法被证实了更符合语音信号的特性,在语音信号的盲分离中具有重要的研究价值。  本文在分析和总结前人研究的基础下,针对瞬时线性混合语音信号的盲分离问题,研究和改进了基于非负矩阵分解的盲分离算法,主要工作如下:  1)总结了盲源分离的研究现状,对语音信号处理和盲源分离的基本理论知识进行了系统归纳,详细介绍了非负矩阵分解的基本算法。  2)针对单通道的混合语音盲分离问题,提出了基于平滑性约束的板仓-斋藤散度非负矩阵分解算法(SM-NMF)。首先将观测信号的功率谱矩阵分解为基本频谱矩阵和时变增益矩阵,从而建立起非负矩阵分解模型;然后对基于板仓-斋藤(Itakura-Saito,IS)散度的目标函数添加能够反映时变增益矩阵平滑性的约束项;最后通过构造辅助函数得到的最小优化算法来迭代地解决新目标函数的优化问题,求出各分解因子矩阵的优化解并重构源信号。通过人工合成及真实环境下的混合音乐段的分离实验证明了该算法的可行性。  3)针对欠定多通道的混合语音盲分离问题,提出了改进的基于板仓-斋藤散度的非负矩阵分解算法。首先对观测信号进行稀疏变换并利用改进的余弦势函数聚类算法来估计混合矩阵的初值;然后将每个源信号的短时傅里叶变换(STFT)看作是一个由多个高斯分量所组成的复杂随机变量,结合统计学中的复杂高斯分布和基于板仓-斋藤散度的非负矩阵分解因子建立起参数模型;最后利用最大期望算法(Expectation-maximization,EM)迭代求解混合矩阵和分解因子矩阵优化解,并对源信号进行重构。通过人工合成的语音段及真实环境下的立体声音乐段的分离实验证明了该算法的有效性和相比其他算法的优异性。
其他文献
φ3.2×5.4m球磨机是矿山的核心设备,而 φ3.2×5.4m球磨机的转动是由开式齿轮来完成的.运行的好坏,故障的维修率发生的高低,直接影响到企业生产成品的质量、产量及整体的经
随着信息技术的发展,Java应用系统、用户和信息量急剧增加,如何对系统资源消耗进行定量测量和定性分析,以便充分合理利用计算资源,提供稳定可靠和快捷的网络服务,是比较重要的课题
切换系统是一类非常重要的混合系统,它是由若干个连续时间或离散时间子系统及一个作用在其上的切换规则组成。在过去的近四十年中,切换系统以其广泛的实际应用背景和重大的理论
创伤、疾病或畸形等常使喉支架软骨破坏或被迫切除,但由于喉软骨缺乏再生能力,病损后难以自身修复,必须利用其它组织或替代材料进行修复与重建。目前多利用自体组织或同种异体组
永磁同步直线电机(Permanent-Magnet Synchronous Linear Motor,PMSLM)由于具有高速度、高精密、大行程和高动态特性等优点,可以减少中间环节带来的误差,能够克服“旋转电机+丝杠”或“旋转电机+齿轮齿条”的固有弱点,满足高精密直线伺服驱动的要求,在激光切割机、高档数控机床等各类高精密工业伺服场合具有重要应用价值。在高精密PMSLM控制系统中,通常采用位置环、速
城市化进程的加快、汽车拥有量的迅速增长使得我国城市交通拥挤日趋严重。拥挤定价作为城市道路交通需求管理措施之一,得到了国内外经济学家和交通学者的广泛关注和认可。实施
图像融合技术是结合来自不同传感器或者是来自同一传感器但在不同条件下获取的图像来产生一个精确、清晰、更加符合人类视觉效果的图像,该技术已广泛地应用在遥感、医学诊断、