基于深度学习的语音重播攻击检测

来源 :广东技术师范大学 | 被引量 : 0次 | 上传用户:long96169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重播他人语音以冒充他人身份会为社会安全带来严重威胁。已有的研究及实践均证明目前的说话人识别系统(Automatic Speaker Recognition,ASR)很难抵抗重播攻击。同时,这种攻击方式还具有便捷低廉的特点。因此,语音重播攻击相关的安全问题研究具有重要的现实意义。然而,目前此类研究仍然相对较少,并且一般集中于利用传统的信号处理方法进行重播语音检测,其特征提取较为复杂且不稳定,具有较大的局限性。为此,本文在数据智能驱动下的深度学习框架内对语音重播攻击的检测算法进行研究,旨在有效区分重播语音和原始语音。具体内容如下:1.提出基于卷积神经网络(Convolutional Neural Network,CNN)模型的语音重播攻击检测算法。所提出的网络结构依据语音信号的时频特征进行特殊设计,与时频图的特征分布特点高度契合,能将训练参数分配到更合理的地方,从而能使用更有效的特征来训练更紧凑的参数,因而大大降低了模型过拟合风险。同时,由于已有的算法通常缺乏通用性,即没有考虑对抗不同录音场景的鲁棒性,本文针对不同的说话人、不同的文本内容、不同的录制设备及不同的录制距离等核心影响因子进行系统的研究与测试。实验结果表明该算法对不同影响因子下的重播语音检测率均达到了99.8%以上,说明该算法具有优良的通用性,另外,本文采用时长0.2秒极短语音段作为检测数据得到以上的准确率,说明所提算法在实际应用场景中具备适用性。2.提出基于循环神经网络模型(Recurrent Neural Network,RNN)的端对端重播攻击检测算法,该算法直接对语音波形数据建模。CNN模型只能对固定长度的语音段进行检测,而RNN的模型则适用于语音长度不定的场合。所提模型采用多组不同长度的一维卷积核及较大的卷积步长来提取语音波形的时序特征,并通过RNN积累历史信息并进行检测,最终实现对各种不同长度的重播语音的端对端检测算法。结果表明该算法对于0.5秒语音段语音有99.3%以上检测率,并随语音段长度增加而增加。但由于语音波形数据特征的稀疏性,基于波形的RNN模型对于极短语音段的检测性能并不理想,对0.2秒语音段只有95.9%的检测率。因此,在此基础上继续提出基于语谱图的RNN模型,并采用迁移学习的方式进行训练。本模型利用特征更为集中的语谱图作为输入;同时,工作1中基于语谱图的CNN模型在0.2秒语音段取得极高的检测率,表明其提取的特征非常有效,因此本工作采用工作1中部分参数来初始化本部分的模型(迁移学习)。实验结果表明该方法极大地提高模型对极短语音的鲁棒性,在0.2秒长度语音段的检测率达到99.3%,并随着语音段长度的增加,检测率越高。本文所提的语音重播攻击检测算法具有优良的性能,可作为ASR系统的检测模块,使其具备抵抗语音重播攻击的能力,对信息安全建设具有重要意义。
其他文献
目的探讨十二指肠乳头肿瘤的CT表现及临床特征。方法回顾性分析12例经病理学证实十二指肠乳头肿瘤的CT及临床资料。结果12例中5例良性者均为腺瘤,7例恶性中5例腺癌,间质瘤及
目的研究结核感染T细胞斑点实验(T—SPOT.TB)对结核性胸膜炎患者的诊断价值。方法比较T—SPOT.TB、ADA检测110例渗出性胸腔积液患者的阳性率、灵敏度、特异度、阳性预测值、阴性
研究目的运动员心脏多年来受到医学领域和运动科学领域的研究关注。到目前为止,运动性心肌肥厚发生的分子机制尚未完全阐明。研究表明,GCN2具有心肌保护作用。因此,我们通过对小鼠进行7周的跑台运动训练建立运动性心肌肥厚模型,并且通过GCN2基因敲除探讨GCN2在运动性心肌肥厚中的作用及调控机制,以进一步解释和认识运动性心肌肥厚的发生机制。研究方法8周龄雄性野生(WT)小鼠和GCN2基因敲除(KO)小鼠,
随着全球气候变暖和温室效应的加剧,天气因素的威胁越来越成为人类难以预料和处理的高危要素之一。天气期货作为能有效转移天气风险的工具,在国外成熟市场上已经广泛应用到各相关行业,取得了较好的天气风险管理效果。我国各区域间差异非常大,降雨量和气温等基础指标不确定性高,天气风险的发生概率也较高,对于天气风险管理有着较高的需求。在这样的背景下,充分地结合本国的气候特点,学习研究成熟市场的发展经验,并将其运用到
目的 探讨局部亚低温联合微创锥颅脑内血肿穿刺引流术对高血压脑出血(HCH)患者术后血清基质金属蛋白酶-9(MMP-9)、降钙素原(PCT)水平变化及神经功能的影响。方法 选取2014年1月至20
三道庄钼钨矿床是栾川县开采最早的一个特大级钼钨多金属矿床。文章通过对其矿体地质特征的探讨,对勘探网度的加密进行了设计。
就上海地区某SPF级实验动物房为例,从设计、施工、调试和运行几个方面探讨了动物房改造项目中需要注意的几点问题,并提出可行的解决办法。
通过对生物制剂厂房灌装区(关键操作区即核心区)单向层流、恒温室、静压差控制、有毒区人员生物安全设计等关键性问题进行分析,提出合理的技术方案,并对这些技术方案的合理性
目的研究全反式维甲酸(ATRA)对OCT4、NANOG阳性U87人脑胶质瘤细胞分化增殖的影响.方法筛选OCT4、NANOG呈阳性的U87人脑胶质瘤细胞,用全反式维甲酸(ATRA)处理细胞后检测细胞增殖、
探究学龄前儿童屈光不正性弱视经矫正治疗的临床治疗结果。方法 选取本院接收诊治的患有屈光不正性弱视的学龄前儿童194例,分为对照组和观察组。对照组采取屈光矫正治疗方式及