基于稀疏约束的声源分离与定位的联合处理算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:LITAO14073164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,远程电话会议、多媒体通讯、虚拟现实等应用对音频数据的采集和重建的性能要求日益提高,除了高质量采样与重建音频信号本身,还需要精确感知和重建原声源所产生的整个声场信息。声场重建的准确性取决于能否精确获取原空间声场中各个声源信号及其对应位置,因此精确的声源分离与定位技术显得尤为关键。现有的声源分离算法主要利用非负矩阵分解(NMF)来实现声音信号的分离,这种方法实现简洁,摆脱了信号统计独立且非高斯的假设,但其对于信号自身特性的利用不足,分离效果有限。而现有的多声源定位算法主要采用波束成形或者求解空间稀疏方程等方法,具有良好的定位效果,但运算复杂度较高,且没有充分利用分离与定位的内在联系。本文在分析和总结前人研究成果的基础上,针对当前多通道声源分离与定位中存在的问题,利用音频信号的稀疏特性改进了基于多通道非负矩阵分解的分离算法,并提出了声源分离与定位的联合处理算法,本文主要工作如下:1)针对多通道声源分离对于信号特性利用不足的问题,本文提出了基于信号稀疏特性的多通道非负矩阵分解算法(SC-MNMF),在传统方法中对于空间相关矩阵的分解过程中,增加非负矩阵分解基的频域稀疏性约束与分解系数的时域稀疏性约束,使得分解结果与实际情况更为接近,并通过实验验证了算法的收敛性,同时在分离性能上,分离信扰比相比其他方法有1-2dB的提升。2)针对空间多声源定位复杂度较高的问题,本文提出了声源分离与声源定位的联合处理算法,利用声源分离中得到的空间特性矩阵实现声源到达角的计算,从而利用声源位置信息使声源分离信扰比提升,实验表明基于联合处理算法使分离信扰比提高了0.5-1dB,声源到达角估计误差也降低了1°左右。本论文的研究实现了基于稀疏约束的声源分离与定位联合处理算法,为精确的声场重建提供了方法和手段。
其他文献
在一些不适合人工作业的极端环境(高温,黑暗,真空,核辐射等)或人力难以到达的环境中,为了监控环境内部部件的状态需要利用机器视觉代替人眼察看极端环境内部现场状态并检查内
农场是农业活动中最基本的一线生产组织单位,在实现农业现代化的过程中起着至关重要的作用。正因为如此,吸引了众多国内外学者对农场发展的理论和实践经验进行研究,主要围绕
回旋管是一种真空电子器件,由于其在高频率波段的高功率、高效率特点,受到国际和国内相关研究机构的重视,并为之开展了大量的研究,目前回旋管在离子加热和诊断、DNP-NMR光谱
砂拉越自主权是1963年砂拉越组建马来西亚时,《马来西亚联宪法》中规定赋予砂拉越的高度自治权,主要指在公共权力、资源支配、宗教教育方面的自主权。这些权利后来被马来西亚
研究目的:颈髓损伤常导致呼吸功能障碍,此类患者生活质量极低,具有很高的死亡率,目前缺乏有效的治疗手段。前期研究中,课题组通过膈神经-迷走神经端侧吻合重建了颈髓损伤大鼠
图像作为最主要的视觉信息载体,从古至今贯穿于人们的生活,一开始图像记录多以纸质、胶片、壁画等形式出现,这些介质随着时间的流逝必不可少的会遭受到空气腐蚀、人为的破坏
随着多媒体信息技术的高速发展,产生了极其庞大的图像数据。如果直接对这些数量庞大的图像数据进行存储和传送,其巨大的工作量将令人咂舌!因此,我们需要尽可能将这庞大的数据
近年来大数据、物联网、无线通信等技术快速发展,作为物联网底层关键技术的WSN受到进一步的关注。由于WSN本身固有的特性和面临的挑战制约了其更好的应用和发展。考虑到SDN对
随着大功率回旋管的发展,其注波互作用腔体越来越大,输出的模式阶数也越来越高,而这些高阶模式不能直接使用,需要借助于准光模式变换器将其转化为高斯模。为了验证准光模式变换器的可靠性,必须在安装之前进行测试,而测试的关键就是设计出准光模式变换器的源。目前国内外有两种不同的设计方式用于产生这种高阶模式的源,一种是同轴波导模式激励器,另一种是同轴准光模式激励器。为了深入研究同轴谐振腔,本文使用表面阻抗匹配法
人脸识别技术在信息安全领域起到了不可忽视的作用,越来越多的车站、机场实行人脸识别自助检票通道,不仅保障了进站人员的安全,而且也节省不少的劳动力、时间和金钱。随着人