一种基于卷积神经网络的端到端语音分离方法

来源 :信号处理 | 被引量 : 0次 | 上传用户：lihaohua008

【摘要】

：

大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了

【作者】

：

范存航刘斌陶建华温正棋易江燕

【机构】

：

中国科学院自动化研究所模式识别国家重点实验室,中国科学院大学人工智能学院,中国科学院脑科学与智能技术卓越创新中心

【出处】

：

信号处理

【发表日期】

：

2019年4期

【关键词】

：

说话人独立语音分离鸡尾酒会问题端到端卷积编解码器 speaker independent speech separation cocktail party

【基金项目】

：

国家重点研发计划(2017YFC0820602),国家自然科学基金(61425017,61831022,61773379,61771472),中国科学院-法国国家信息与自动化研究所联合研究项目(173211KYSB20170061).

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方

其他文献

基于多项式卡尔曼滤波的船舶轨迹预测算法

考虑到在船舶航行的实际过程中,船舶自动识别系统(AIS)设备提供的船舶运动点迹往往呈现出信息缺失、非线性、多机动的问题,导致利用AIS设备辅助海上指挥系统难以准确判断船舶

期刊

船舶自动识别系统多项式分布卡尔曼滤波航迹预测automatic identification systempolynomial distributio

建立新闻创新的保证体系

在市场大潮面前,不管是传统媒体还是新兴媒体,不管是综合性媒体还是专业性媒体,都不可能再像以往那样平静而自主地生存."以市场为导向"不仅应该是需要树立起的牢固观念,而且

期刊

新闻创新创新评价体系人才培训体系创新协作体系

采访“名人”的艺术

一篇新闻报道能否成功,采访成败至关重要.尤其是访谈类新闻的写作,当被采访对象是高级领导干部、艺术家、知名教授或著名企业家等"名人"时,成功地组织采访显得更为关键.

期刊

新闻报道新闻采访知名人物采访艺术

采访中的“危机”处理

批评和揭露性新闻的采访,记者遇冷脸、遭谩骂是家常便饭,弄不好还有拳脚棍棒之灾.所以,培养和锻炼记者的"危机处理"能力,显得至关重要.一、智破"接近危机".接近采访对象,获取

期刊

新闻报道新闻采访读者“危机”处理

如何创建一个远程数据服务（RDS）

本文从Web数据库体系结构的角度探讨了RDS的工作原理和关键技术,并结合一些代码,具体阐述了远程数据服务的实现。

期刊

远程数据服务数据库体系结构工作原理RDSWEB代码Refresh Execute Options Fetch Options Ready State

标准数据集合的分析与设计

标准数据是用于比对发现错误数据记录的一类数据，在病态数据检测中具有极其重要的意义。而目前的标准数据研究还处于录入数据库阶段，造成调用困难且准确性不高。本文分析了标准

期刊

标准数据集合病态数据检测Standard Data Set Pathological Data Detection

非均匀噪声背景下混合信号DOA估计算法

针对非均匀噪声背景下非相关信源与相干信源并存时波达方向(DOA)估计问题,提出了基于迭代最小二乘和空间差分平滑的混合信号DOA估计算法。首先,该算法利用迭代最小二乘方法得

期刊

阵列信号处理波达方向相干信号非均匀噪声空间差分array processingdirection of arrival(DOA)estimation

一种基于卷积神经网络的端到端语音分离方法

与本文相关的学术论文