【摘 要】
:
如今,人们对通过生物特征进行识别的方式的关注度逐步增高,现在已经发展成为了一个热点课题,其中的重要分支对说话人进行识别也随之进入了人们的视线。说话人识别操作简便,成本低廉,比起其他生物识别方式更容易被人接受。本文的目的便是尽可能快速且准确地对说话人的身份进行识别,并通过语音增强的方式减弱可能会有的噪声影响。主要工作如下:首先,我们对语音进行预处理和特征提取,通过矢量量化的方式,利用得到的语音特征来
论文部分内容阅读
如今,人们对通过生物特征进行识别的方式的关注度逐步增高,现在已经发展成为了一个热点课题,其中的重要分支对说话人进行识别也随之进入了人们的视线。说话人识别操作简便,成本低廉,比起其他生物识别方式更容易被人接受。本文的目的便是尽可能快速且准确地对说话人的身份进行识别,并通过语音增强的方式减弱可能会有的噪声影响。主要工作如下:首先,我们对语音进行预处理和特征提取,通过矢量量化的方式,利用得到的语音特征来生成初始码本,并采用LGB算法经过大量训练之后寻求到最佳的码本。再将待测语音与最佳码本进行对比,以此方式实现了一个能够识别说话人身份的说话人识别系统。该系统在识别过程中与说话人所说语言种类,以及文本内容都没有关系,只与说话人所具有的声音特征有关。这是一个文本无关的通过声纹来识别说话人的系统。其次,我们研究了一种广义的端到端的说话人识别的损失计算方式,通过批处理的方式加快整个系统在训练数据时的速度,并利用Softmax损失函数使属于同一说话人的嵌入向量尽可能的逼近其形心,从而减少因为用户数量的暴增所造成的损失。最终得到的结果说明了现有模型的性能要优于传统的模型。最后,为了减弱噪声等因素对识别结果的影响,我们提出了一种添加了混合注意机制的wav2vec2.0的对比学习框架。这种混合注意力模型,是在原有的基于内容的注意力模型上添加位置信息,综合考虑所产生的注意力向量,以减小相似特征的影响。我们发现改进后的框架对噪声确实有着更加好的鲁棒性。综上,本文基于语音增强技术,实现了一种与文本无关的说话人识别系统,通过该系统能够对说话人的身份进行识别。实验结果表明,该系统在准确性和鲁棒性上都表现良好。
其他文献
为了调查广西地区犬细小病毒(CPV)的优势毒株及其遗传变异情况,试验利用PCR方法对采自广西地区的423份犬血清样本进行CPV检测并扩增其VP2基因,利用MegAlign软件进行同源性比对并分析VP2蛋白主要突变的氨基酸位点,同时利用MEGA 7.0软件采用邻接法构建遗传进化树。结果表明:共获得55份CPV阳性血清样本,阳性率约为13.0%。PCR扩增得到大小约为1 755 bp的VP2基因。55
随着医院放射科医疗信息化的发展,病人病例报告数据对于医院来说越来越重要。以往的病例报告数据都在放射科信息系统中,其中病例报告数据没有统一的模板管理,也没有疾病标签和关键征象词关联,医生书写和查阅起来非常麻烦。放射科在此基础上,提出了建设放射科病例报告信息系统的需求。针对这一问题,本课题设计并实现了病例报告系统,大大方便了医生书写和查阅病例报告,能够提供病例存储库和病例学习平台,为病例报告提供了系统
21世纪以来,互联网的迅猛发展推动了各行各业的进步。在教育行业,传统的线下教育已经很难满足人们的需要。城乡教育资源的不平衡不充分发展,导致城乡教育差距越拉越大。虽然市面上也有许多在线学习平台,但是质量参差不齐,比如学习资源繁杂,让用户无所适从;学习方式单一化,有的平台仅仅只能点播视频无法为用户量身打造、推荐出用户感兴趣的课程,用户体验性较差;平台所使用的技术架构为传统的单体架构,在复杂的用户场景下
近年来海事信息化建设高速发展,随着海事政务服务平台“海事一网通办”平台的投入使用,标志着海事系统数据融合进入新的阶段,但是包括“一网通办”在内的各种海事信息服务平台都采用高度集中的中心化部署方案,信息发展新阶段越来越要求各信息系统的数据共享与开放程度要适应航运的发展速度,另外随着国家对数据安全的重视,对涉及国家行业数据、个人隐私数据的保护也有着极高的要求。区块链拥有分布式存储、防篡改和加密机制,可
为了使用户能够准确、高效地分析信用卡数据,信用评分的决策与预测已成为研究热点之一。信用卡数据是具有代表性的海量数据。随着信用卡相关领域的扩大,信用卡数据逐渐被各种高维数据所代表。因此,对于信用卡大数据市场来说,如何提供一个自动化的信用卡数据分析和集成环境,如何有效地转移和重新分配信用度已成为当务之急。本文主要研究了信用卡的数据建模问题,寻找影响信用卡的信用度好坏的因子,并根据多种数据分析算法的结果
随着电子技术的快速发展,信息化产品的更新与迭代速度也逐步加快,车联网、芯片等各行业对新型电子产品的设计提出了更轻量化、集成化需求。然而,电子技术的发展离不开EDA(Electronic Design Automation,电子设计自动化)软件的帮助,这类软件是一整套设计电子系统的辅助工具,为电子产品设计系统集成开发提供了从初始设计、电子调试到迭代更新等工具支持,从而推动电子产品小型化、快速化发展,
数据库索引技术是一个有几十年历史的研究领域,随着内存数据库和人工智能技术的发展,研究人员可以采用一种新的视角来考虑索引结构的设计。在磁盘数据库系统中,B+树是一种非常流行的索引结构。但是根据最近研究表明,B+树索引会占用超过50%的内存空间,这大大降低了可用于存储有效数据的空间。与传统的B+树索引相比,机器学习索引无论是从内存空间占用还是查询性能方面都有一定程度的优化。但是机器学习索引仍然面临一些
随着中国经济和重工业的迅速发展,中国在基建方面取得了显著的成就。为了保证工人的人身安全,进入工地人员佩戴安全帽已成为硬性要求。传统的工地安全帽监管是人工监视的方式,然而人工监视时间长容易出现漏检且效率低下。近年来,随着深度学习等人工智能技术的发展,基于深度学习的安全帽检测方法在工业上取得了越来越广泛的应用。基于深度学习的安全帽检测方法是通过深度神经网络训练得到的,需要强大的GPU算力支持,并且部署
随着互联网技术与电子商务仓储的融合发展,现代仓储作业模式正逐步从传统人到货模式转型为货到人模式。新的技术融入给仓储作业带来了更多新的可能,也给物流速度带来了更多挑战。本文以某电商仓库为对象,通过对实际拣选作业环境调研,发现仓库拣选效率低下,且现场订单结构比较复杂,每日拣选的商品重合度较低,仓库整体规划也缺乏严格的品类库存管理。针对以上问题,本文基于货到人拣选模式,设计并实现了全新的拣选系统,方便企
目的:观察程序化护理管理对风湿免疫科住院患者失眠率的影响。方法:选取2018年6月至2021年2月福建医科大学附属福州儿童医院收治的风湿免疫科住院患者100例作为研究对象,按照随机数字表法分为观察组和对照组,每组50例。对照组给予常规护理管理干预,观察组给予程序化护理管理干预。采用失眠严重程度指数(ISI)比较2组患者失眠症状改善情况,采用舒适状况量表(GCQ)比较2组患者的感受,比较2组患者遵医