基于帧级特征的端到端说话人识别

来源 :计算机科学 | 被引量 : 0次 | 上传用户:gksword
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的说话人识别方法仍存在许多不足。基于话语级特征输入的端到端方法由于语音长短不一致需要将输入处理为同等大小,而特征训练加后验分类的两阶段方法使得识别系统过于复杂,这些因素都会影响模型的性能。文中提出了基于帧级特征的端到端说话人识别方法。模型采用帧级语音作为输入,同等大小的帧级特征有效解决了话语级语音输入长度不一致的问题,且帧级特征可保留更多的话者信息。与如今主流的两阶段法识别系统相比,端到端的识别方法将特征训练和分类打分一体化,简化了模型的复杂性。在训练阶段,每段语音被分帧成多个帧级语音输入到卷积神经网
其他文献
虽然近些年我国在电力建设行业投入大量的资金与研究力度,电网能源供应愈发完善,但是,在电力使用过程中,经常出现各类安全事故,对人们的生产生活带来很大的影响。根据行业建
<正> 用一热水瓶的水就能将一辆满是尘土的轿车浑身上下洗得干干净净,这是最近在上海机动车清洗管理处召开的节水洗车现场会上见到的&#39;奇迹&#39;。而更让人高兴看到的是,3
在需要进行大量数据并行计算的算法(如云计算、机器学习算法、人工智能算法等)中,FPGA作为一种提升性能的重要技术手段,得到了广泛的应用。FPGA配置方式中,需要在存储器中读
永续债的引入,为企业提供了一种新的融资方式。本文重点比较分析了财政部先后印发的关于永续债相关会计处理的两个文件,指出了存量永续债按照新文件处理时存在的主要问题,结
青海量具刃具有限责任公司是我国规模最大的千分尺生产公司,生产的千分尺品种、规格最为齐全.质量最优。除千分尺外,公司还生产卡尺、量表、量仪及刃具等产品,已经建成初具规模的
2008年即将翻过最后一页,在迎接新年到来的同时,我们记忆的闸门也悄然打开,过去一年里,发生在中国舞坛的许多令人难忘的人和事又一幕幕地在眼前闪现…… In 2008, when the
安世亚太(PEBA Global)在十年前只不过是一个小小的三人办事处,仅仅依靠销售ANSYS软件产品支撑门户;十年后,安世亚太不但成为了中国CAE行业的航空母舰,还具有了自主研发能力,成为中
“开箱即用”方案就是为了简化PDM/PLM系统的导入和实施。这就像提供给客户麻醉剂以帮助他们消化掉这些应用程序。我一直在担心的一个问题是“开箱功能的选项”是否有能力满足
本文从高校全面预算管理与绩效评价存在的问题入手,进行了详细的分析,并提出基于战略导向的高校全面预算管理体系的构建与绩效评价体系完善的策略。该战略导向的高校全面预算
今年,经济危机依然肆虐全球,然而华北制药集团先泰公司并未停止开拓市场的脚步。今年上半年,出口量不降反升,并通过了欧洲GMP认证,标志着先泰公司的生产质量管理跨入国际cGMP先进