【摘 要】
:
在当今社会,入室盗窃、冒名替考等违法行为还时有发生,这暴露出了一个严重的问题,即传统的身份认证方式极易被不法分子攻击,导致信息泄露,带来巨大安全隐患。随着大数据时代的到来以及物联网技术的飞速发展,身份认证的手段越来越多,认证方式也越来越安全。声纹作为个体独特的生物特征,满足当下身份认证对可靠性和特有性的需求,声纹识别技术应运而生,其支持远程认证且具备更强的便捷性、安全性,具有广泛的应用前景。虽然目
论文部分内容阅读
在当今社会,入室盗窃、冒名替考等违法行为还时有发生,这暴露出了一个严重的问题,即传统的身份认证方式极易被不法分子攻击,导致信息泄露,带来巨大安全隐患。随着大数据时代的到来以及物联网技术的飞速发展,身份认证的手段越来越多,认证方式也越来越安全。声纹作为个体独特的生物特征,满足当下身份认证对可靠性和特有性的需求,声纹识别技术应运而生,其支持远程认证且具备更强的便捷性、安全性,具有广泛的应用前景。虽然目前研究人员一直对声纹识别技术进行研究,但算法的准确率仍未达到一个令大众完全放心的水平,亟需进一步提升。因此,本文关注于文本无关的声纹识别,设计并改进了识别系统中音频预处理和用于构建识别系统的神经网络模型部分,并引入了多个含有声纹信息的特征,提升了声纹识别系统的识别性能。论文首先对数据集中的音频数据进行预处理,主要包括:分帧、语音活动性检测以及加窗。并基于所提取的特征对音频的预处理阶段进行针对性的改进,在研究了音频的清音段在使用线性预测系数(Linear Prediction Coefficient,LPC)复原音频时产生较大预测误差的问题后,将音频中的清音段通过比较短时过零率的方法进行检测并消除,减少了对于特征提取来说无用音频帧的数量,使其更适用于进行声纹识别。在对音频进行预处理操作后,论文基于人类的声音由产生到人耳接收的流程,对音频进行特征提取。提取了音频的LPC特征,该特征可以对人类声道进行建模;以及提取了Log梅尔谱(Log-Mel)系数,该特征对人耳听觉感知能力进行建模。并对LPC特征进行其二阶差分的提取,以获得LPC的变化特征,使其拥有更好的动态特性。最终经过多次特征融合,得到最适合于声纹识别的声纹特征。在充分研究了传统算法与深度学习算法在声纹识别任务上的优劣后,论文选择使用长短时记忆神经网络(Long Short-Term Memory Networks,LSTM)作为本文声纹识别的基础框架,并将其优化为双向LSTM神经网络。通过比较不同隐藏层的数量下神经网络训练100000轮后的softmax损失函数数值,最终选择使用两层双向LSTM神经网络作为最终所使用的神经网络。针对相似度向量使训练速度慢且算法灵活性差的问题,将相似度向量优化为相似矩阵,从而解决了上述问题并使声纹识别准确率有了进一步的提升。本文使用的数据集为VCTK英文语料库,该语料库包含109位说话人,每人300-400个5-10秒、采样率为48 k Hz的音频文件。将其中的89位说话人的音频文件用于训练,20位用于验证与测试。在录入说话人占比为20%时,经过100000组的测试,得到声纹识别的平均准确率为96.985%的实验结果。
其他文献
光纤Fabry-Perot(F-P)传感器以其易复用、耐高温、耐腐蚀、高灵敏度、响应速度快、低制造成本、小尺寸、高精度、同时测量等独有特性,而在航天航空、机械制造、生物传感、结构健康监测、石油化工、环境检测等领域应用普遍。本文从Vernier(游标)效应理论出发,针对目前存在的灵敏度放大瓶颈和大范围测量难题,创新匹配条件理论,并设计验证了应变和液体折射率光纤传感器。针对游标效应匹配条件的研究不足,
光纤传感器具有非常多的优势,具体表现为传感结构的多元化、动态测量范围大、高灵敏度、抗腐蚀、结构紧凑小巧等,常常被应用于结构健康监测中。光纤传感器小型化的优势可以深入到结构体内部实现结构健康监测,其中超声探测、应变、温度为结构健康检测的基本参数。布拉格光纤光栅(Fiber Bragg Grating,FBG)内置型光纤激光器型超声传感器可以利用光纤激光器的高响应度和高能量输出特性,实现对高频和脉冲信
大量新型显示技术的涌现,极大地丰富了人们与电子设备的交互方式,而显示屏体作为人机交互最重要的媒介,其性能与质量直接影响着用户体验,因此人们对屏体的显示效果也有了越来越高的需求。然而,显示屏体因其复杂制作工艺,在生产制造或运输过程中不可避免的引入了一些影响其显示效果的缺陷,而这些缺陷会直接决定屏体的质量。因此,在屏体生产过程中以及出厂前,进行缺陷的检测是非常必要的。当前,屏体的缺陷检测还完全离不开人
ARL8B为进化过程中保守的Arf-like类小G蛋白。在动物细胞中,ARL8B的细胞生物学功能已经得到了相对广泛的研究。ARL8B在动物细胞中可以通过调控HOPS复合体亚基VPS41来介导晚期内吞体与溶酶体的膜融合过程以及介导溶酶体向细胞外周的转运过程。虽然,但ARL8B在拟南芥中的同源蛋白ARLA1A是否具有保守的功能目前还不清楚。本课题通过生化、遗传和细胞生物学实验证实了ARLA1A也能与植
20世纪80年代,世界卫生组织(WHO)在第一届健康促进国际会议上发表了《渥太华宪章》,提出“人人享有健康”的战略思想,健康逐渐成为了人类发展的重大议题。随着20世纪90年代到21世纪初各类主题会议的召开以及《关于身体活动有益健康的全球建议》的出台,世界范围内掀起了“体育为健康运动”的风潮。1995年6月,国务院出台了《全民健身计划纲要》,我国也开始了体育与健康方面的相关探索;进入21世纪后,我国
近年来污水厂二级出水氮磷浓度高于水体富营养化阈值的现象广受关注,但传统污水深度处理方法存在高能耗、高碳排放和污染转嫁等弊端。因此,可持续型深度处理技术亟待研发。微藻光合效率高,能高效吸收、吸附污水中氮磷等污染物,且微藻可用于生物能源和高价值产品生产。将微藻用于污水深度处理极具现实意义和商业化前景。低成本的生物质采收、持续稳定的脱氮除磷效果是发展以微藻为基础的污水处理技术亟需突破的瓶颈问题。课题围绕
靠近壁面的弹性支撑方形截面柱体结构的流致振动研究在理论及工程应用中具有重要意义。现实生活中,靠近壁面的方柱结构广泛存在,如靠近地面的方形悬索桥,靠近建筑物表面的排风方管、海洋钻井平台等。早先研究发现,在某些特定情况下的流动会对方柱结构的振动状态产生明显影响,甚至诱发弛振等剧烈振动现象从而缩短结构的使用寿命。而在方柱附近的某些结构可以在一定程度上影响其附近的流动特性,进而改变振动响应特性。因此,理解
近年来随着无人机和通用飞机的推广应用,先进飞行器朝着智能化、多任务化的方向发展,人们对于飞机性能的要求不断提高。机翼作为飞机的重要组成部分,对机翼的变形能力、承载能力、重量和气动性能等方面有了更高的要求。然而,目前机翼的变弯度形式主要采用襟翼、缝翼等形式,具有单一任务的特点,且不能保证连续无缝变形。为解决这一问题,设计了一种可连续变弯度机翼后缘结构,完成了其力学建模与尺度优化,并验证了其空气动力学
近年来,随着移动数据需求的爆炸式增长,现有移动通信系统难以满足未来的发展需求,第五代移动通信系统(5G)已经成为通信业和学术界研究的热点内容。5G技术以高速率、低延时、泛在网和低功耗等特性为研究目标,具有广阔的发展前景。相比于前几代移动通信系统,多样化的业务需求是5G技术所独有的特点。具体来说,5G网络不仅需要满足前几代移动通信系统的高速数据传输等基础功能,还要满足不同节点之间的稳定互联,包括所有
近年来,直径在纳米范围内的纳米碳纤维由于其卓越的化学性质、电学性质以及独特的一维纳米结构而受到越来越多的关注。静电纺丝是制备连续纳米碳纤维的简便途径,但是其所制备的纤维强度无法达到预期,限制了其使用价值,如何提高纳米碳纤维整体的机械强度,使其能够承受一定的力而不容易破碎,成为目前研究的重要内容;随着社会的发展,清洁能源的开发越来越受到人们的重视,质子交换膜燃料电池由于其启动快,工作温度较低,高功率