基于深度双向LSTM网络的说话人识别

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:JK0803Tangxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为进一步提高说话人识别的准确率,提出一种基于深度双向长短时记忆(long short-term memory,LSTM)网络的说话人识别方法,实现文本无关端到端的说话人身份识别。双向利用语音的序列数据,通过记忆单元,增强上下层之间的联系,提高对语音序列数据的分类能力。实验结果表明,在实验室环境下,对5 s时长的短语音,正确识别率达到97.92%,对噪声干扰具有良好的鲁棒性。该方法能学习语音序列信号特征,应用序列变化信息,可有效进行说话人识别。
其他文献
SAR图像较大难以实时运行且船只目标较小难以被识别,为此一种压缩级联深层神经网络算法被提出以实现对众多船只目标的分割定位识别。构建3个不同的卷积神经网络实现特征提取,
为提高恶意代码检测准确率,增强网络空间的信息安全性,提出一种恶意代码自动检测判定方法,基于同种恶意代码同源性特征,融合级联操作与深度信念网络。分析不同类型下的恶意代
随着社会经济的发展,老龄人口数量逐渐增多,传统家庭结构发生了变化,老龄化成了一个重要的社会问题。日本在养老服务体系的建设上取得不少值得借鉴的有效成果,为解决中国目前
为解决传统用于文本分类等时序性问题的循环神经网络无法留住长远记忆及模型框架复杂的问题,提出一种基于序列卷积神经网络的分类模型。利用卷积的思想处理时序性问题,将因果
采用化学共沉淀法,在较低温度(750℃)下制备了具有缺陷烧绿石结构的复合氧化物Cd2Sb2O6.8的纯相超微粉;研究了制备条件对物相、结构和气敏性能的影响,并对其反应过程机理进行了探讨.气敏性能测试
针对当前视觉同步定位与地图构建(visual simultaneous localization and mapping,VSLAM)算法鲁棒性较差,无法生成适合自主导航的语义地图等问题,提出一种基于实例分割的视觉SLAM算法。在对输入图像提取特征点的同时,使用卷积神经网络对图像进行实例分割;利用实例分割信息辅助定位,剔除容易造成误匹配的特征点,缩小特征匹配的区域;使用实例分割的语义信息构建语义地
为解决基本人工蜂群算法收敛速度慢、开发能力不足的问题,提出多策略混合搜索的人工蜂群算法。在雇佣蜂阶段采用两个具有不同探索与开发特征的搜索策略,分配不同的混合比例,
针对传统异常检测方法在处理多元和高维数据时检测性能较差的问题,提出一种融合弹性网和深度去噪自编码器的网络异常检测方法。构建一种基于弹性网的深度去噪自编码器,利用部
<正>公主岭市双城堡镇是一个拥有近8万人口、3.2万公顷耕地的农业大镇。随着农村产业方式的快速转变,传统农业已不适应新时期的经济发展。近年来,这个镇以生产西瓜、甜瓜为突
中小企业是我国市场经济发展的重要组成部分,同时,财务管理作为中小企业管理工作中的核心内容,对提高企业效益起到不可替代的作用。然而目前,我国中小企业由于受到管理者传统