【摘 要】
:
在传统电力调度通信系统中,通话双方的语音内容被存储在单个录音文件中。如何将通话双方的人声区分开来,对于语音识别和声纹识别在电力调度领域应用具有重要的作用。当有多人
【机 构】
:
国网福建省电力有限公司信息通信分公司,广州广哈通信股份有限公司
论文部分内容阅读
在传统电力调度通信系统中,通话双方的语音内容被存储在单个录音文件中。如何将通话双方的人声区分开来,对于语音识别和声纹识别在电力调度领域应用具有重要的作用。当有多人同时说话时,如何将这些人声区分开来的问题,被称为鸡尾酒会问题。为解决鸡尾酒会问题,特别是单通道双人语音分离问题,提出了基于注意力机制的深度聚类网络。首先提取语音信号的MFCC特征,其次将其输入到神经网络提取更高维度的特征,再次采用注意力机制为每一特征分配权重,最后采用k-means聚类将同一说话人的语音聚类输出。在wsj0数据集上,所提算法模型相
其他文献
2010年6月19~21日,中国机械工程学会九届四次常务理事会(扩大)会议暨“第二届高档数控机床与制造工艺创新论坛”在济南召开,同期举办了“中国创新论坛”之“走进山东”系列活动,并
本文结合CAD的三维建模技术与实体特性查询功能模拟悬挂法求解冲裁模压力中心,运用解析法验证了CAD技术模拟悬挂法求解结果的可靠性,二者的偏差为0.000001 mm,表明运用CAD技
针对光信号在非保偏环境下传输偏振态随机变化的现象,设计了一种可实时保持信号偏振态稳定的系统,用于光纤通信系统接收端。该偏振稳定系统采用基于偏振跟踪的直接检测方案,
基于广义正交匹配追踪,提出了一种在压缩感知框架下,适用于任意块稀疏信号重构的算法。该算法以贪婪迭代为核心,在迭代过程中利用一种新的方法寻找非零块,达到了非零块估计方
介绍了康乃馨温室栽培管理技术,包括品种选择、定植前准备工作、定植技术、种植后田间管理技术、常见病虫害防治、采收技术。
[目的]研究氮化钛涂层对牙科铸造合金腐蚀性能的影响.[方法]两种义齿常用的Ni-Cr合金、Co-Cr合金经常规包埋铸造成Ni-Cr、Co-Cr合金铸件,模拟临床打磨抛光形成20 mm×20
探究性学习是落实核心素养比较有效的方式之一.文章以教材中的“阅读材料”为内容,借助GeoGebra软件辅助探究了函数y=ax 2+bx+c的系数a,b,c与图像的关系,借此初步探讨如何设