论文部分内容阅读
乐音信号分离是指从混合乐音信号中分离出单个或多个人们感兴趣的乐音源信号。在复杂的声场环境中,人耳听觉系统可以轻松的分离出人们感兴趣的乐音源信号,并对这一信号保持高度的关注。人耳这种良好的声源分离能力促进着人们对乐音信号盲分离问题的研究。本文分多通道、单通道混合模型讨论了乐音信号盲分离问题,其中多通道混合模型又可分为正定模型和欠定模型。首先,通过分析乐音信号的时频统计特性,假定乐音信号符合超高斯分布,且类似于拉普拉斯分布。在正定模型中,文章引入独立成分分析(ICA,Independent Component Analysis)思想实现多通道乐音信号盲分离,讨论了基于峭度、负熵、似然度等独立性指标的算法对乐音盲分离的适用性,并发现基于负熵的算法分离性能最好。其次,假设乐音信号在变换域足够稀疏,利用稀疏成分分析(SCA, Sparse Component Analysis)方法实现欠定模型下的乐音信号盲分离。实验表明频域混叠是影响稀疏成分分析方法分离效果的最大因素。最后,将子空间分解的思想引入非负矩阵分解法(NMF, Nonnegative Matrix Factorization)用以解决单通道乐音信号盲分离问题。文章认为影响非负矩阵分解方法分离性能的主要因素是时频混叠。针对这一影响因素,文章在非负矩阵分解法的基础上加入时域改善和频域改善模块,利用乐音谐波特性和谐波时间包络相似性抑制了时频混叠对分离效果的影响。实验表明加入改善模块之后,分离信号的听觉质量有了明显的提高,乐器的分离效果尤为突出。