基于深度神经网络的鲁棒性说话人确认方法研究

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:huazhexingyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人确认是判断给定的语音信号是否来自指定说话人的一项技术,在各种场合的用户身份认证中均有重要的应用价值。说话人确认技术在纯净语音条件下已经取得了令人满意的效果。但是,在实际应用中,系统的性能还会受到其它条件的影响,其中噪声干扰影响最大。为缓解噪声干扰问题,本研究在说话人确认中结合了语音分离任务。本文提出一种基于DNN的语音分离和说话人确认联合训练的框架,该框架将语音分离部分产生的对噪声具有鲁棒性的特征应用在说话人确认网络,能够显著提高说话人确认的准确率。具体来说,提出的联合训练框架包括两个部分:基于卷积循环网络的语音分离模块和深度残差网络结构的端到端说话人确认模块。语音分离模块的中间层——循环网络的输出经过注意力机制后作为鲁棒性特征与原始混合语音特征拼接,作为说话人确认模块的输入。实验结果表明,该方法的抗噪性能远优于传统方法。在此基础上,考虑到循环网络刻画时间相关性的能力随着序列长度的增加而减弱。本研究提出对不同长度的输入序列,使用注意力机制形成表示向量。每一帧输出一个向量,该向量包含了之前所有帧的信息,使最终的特征序列包含有更多的说话人信息。实验表明,包含注意力机制的联合训练框架在多种情况下的性能相比多个基线系统均有显著的提升。
其他文献
随着化石燃料等不可再生能源的日益枯竭,氢能源作为一种新型的二次能源备受瞩目。碱性水电解法是电解制氢最常用的工艺之一。但是大多数工业电解水需要耗费大量电能,因此电解水技术不能大规模发展。Pt、Pd及其合金有很低的析氢过电位并且电解析氢稳定性良好,但因为价格昂贵,应用受到限制。因此寻找成本低廉且析氢性能良好的电极材料具有重大意义。Ni基多孔阴极材料由于具有较低的析氢过电位以及优异的电催化析氢性能而被广
《达洛卫夫人》素有“伦敦小说”之称,伍尔夫将对城市的展现融合于人物迅速变动的意识流动之中,在人物的意识屏幕上呈现对于城市的透视。本文将通过小说主要人物克拉丽莎和塞
为有效防治辣椒疫霉病,对辣椒疫霉病田土壤进行了病菌分离、菌株配对培养、越冬存活形式等研究.结果表明:病田土壤中的疫霉菌数量有明显的季节性变化,以5~8月最多,冬季和初春
市场经济不断发展和进步,人们对于食品安全的关注度逐渐加大,为有效提升畜产品质量安全管理水平,要积极落实系统化的动物检疫机制,践行精细化管理要求。该文简要分析畜产品质
为合理选配亲本,充分利用杂种优势提供依据,采用聚丙烯酰胺凝胶电泳法检测了140头猪的11种血浆蛋白质(酶)多态性,并测定了部分经济性状。在此基础上计算了基因平均杂合度及其与部
云计算是一种用于实现对可配置计算资源,如网络、服务器、存储、应用程序等,进行按需网络访问的模型。这些可配置计算资源可以以最小的管理代价为需求者提供方便、快捷的服务