合成语音检测的关键技术研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jk305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和人们对生活便利性的追求,大量依靠生物特征构建的识别系统正在逐步取代传统的密钥验证,其中声纹具有特定性和相对稳定性的生物特征,在越来越多的认证系统中被使用。而随着语音合成技术的发展,使得人们可以利用计算机生成与自然人说话语音十分类似的合成语音,这一技术在提高自动语音应答服务质量的同时,也给基于声纹识别的说话人认证系统的安全性带来挑战。犯罪分子可以轻易的获取用户的个人语音信息,通过训练语音合成模型得到能够欺骗识别系统的伪造语音,进而完成对用户的门禁系统、电话银行等信息敏感设备的攻击行为,对用户造成经济损失甚至危害其生命健康。本课题的研究目标是通过对现有语音合成系统进行研究,分析该类系统自身存在的缺陷和产生的合成语音与自然语音的区别,针对性地设计新的合成语音提取算法和检测模型,并对模型进行优化使其在含噪声的语音检测任务中具有更好的鲁棒性。本课题主要做了以下研究工作:1.通过分析现有的语音合成技术及其合成结果,参考已有的语音特征提取技术,设计了基于对称梅尔倒谱系数(SMFCC)的特征提取算法,并通过实验对比得到该算法在合成语音检测任务上具备良好的性能的结论。2.设计并实现了基于时序卷积的端到端合成语音检测模型(EETCN)。通过对EETCN进行参数优化和调整,得到了最优超参数组合,并通过与MFCC+GMM模型、深度神经网络模型等合成语音检测系统进行实验对比,所得结果显示EETCN模型在合成语音检测任务上具备着良好的性能。3.设计基于残差收缩的合成语音检测模型(RSBU-EETCN)。研究了噪声对EETCN模型性能的影响,结合深度残差收缩模块在降噪方面的良好表现,对EETCN模型进行优化改进。通过与维纳滤波和MMSE语音增强算法的对比试验,发现RSBU-EETCN模型在有噪声语音的检测任务上具有性能优势。4.在对合成语音检测技术和模型构建的研究基础上,综合运用多项软件开发技术,设计并实现了合成语音检测服务的原型系统,实现了EETCN模型和RSBUEETCN模型的相关算法,提供了模型训练、模型更新与管理、以及合成语音智能检测服务等功能,并对该系统进行了测试。
其他文献
在当今社会,人脸识别技术在许多领域被广泛应用,然而在例如车站、机场等人员流动频繁,周边环境复杂的无约束场景下,由于被识别人员存在姿态变化、表情变化、光照变化以及遮挡等问题,采集到的人脸图像质量参差不齐,因此需要对采集的人脸图像进行质量评估,同时也需要对无约束条件下人脸识别算法进行研究改进,要求设计的人脸识别算法能够克服无约束条件下众多干扰对识别带来的不利影响。因此解决在无约束条件下人脸识别的应用问
计算机科学和信息技术等相关领域的蓬勃发展,使各种类型传感器的普及度大大提高的同时,人们对采集不同模态与频段图像的需求也快速增长。单一传感器捕获的场景信息表现出一定程度的局限性,难以满足更多应用的需求。由于不同类型传感器获取的信息之间具有天然互补性,能够在不同应用场景下进行应用。多源图像融合技术旨在将多种不同频段不同模态的图像进行分析整合,从而获得更为全面的成像信息。该领域中最为典型的即是红外与可见
随着云计算的发展,企业将业务移入云端已经成为一种趋势。云计算是一种按需付费的模式,企业不再需要按照传统方式在开发前购置大量物理设备,可将项目整体移入云端,这种方式降低了企业的开发成本和运维成本,同时高了资源的利用率。从整体看,云计算加快了企业信息化的速度,带动了其他行业的增长。目前云产品供商供了各类云相关服务,或借助于云计算带来的优势,开发了相关的轻型应用服务,以满足用户协同办公、云剪辑、云设计等
空间激光通信(Free Space Optical Communication,FSO)需要建立稳定的通信链路来保障通信质量,并且空间中环境复杂多变,因此对通信两端的端机对准程度和通信过程中的实时跟踪性能要求很高。针对这一需求,本文本将主要从激光光斑位置检测和跟踪控制技术两方面入手进行重点研究,来保证FSO的通信链路的稳定,主要工作内容如下:1、首先通过对光通信常用的3种光电探测器进行性能的分析对
1883年,英国科学家雷诺通过圆管实验,发现了流体有着两种不同的流动状态,分别为层流和湍流。从此,人类开启了对流体复杂流态特性的研究。随着对流体力学研究的不断深入,转捩与分离问题逐渐成为近百年来最重要的研究课题之一,也是导致航空飞行器设计不确定性主要来源之一。在日常生活中,转捩与分离现象十分普遍,但其存在的随机性与不确定性和缺失必要逻辑层面的准确定义致使该理论的发展目前尚不成熟。因此,在流体机械的
数值求解含流体双相介质和黏弹性介质中地震波传播方程,并进行波场模拟,对于油气勘探等具有十分重要的理论和实际意义。本文基于Birkhoffian系统,发展了求解双相介质和黏弹性介质中波传播方程的保辛方法。对于描述双相介质中弹性波传播的方程,首先构造了其相应的Birkhoffian系统,以及包含位移和速度梯度信息的广义Birkhoffian系统,然后在此基础上发展了求解弹性波方程的保辛方法(简称SSM
随着现代科学技术的发展,越来越多的科学与工程领域中的问题需要借助科学计算方法来求解。其中许多问题定义在无界区域上,而传统方法并不能有效地求解此类问题,人工边界方法是过去几十年发展起来的求解此类问题的重要方法之一。本文将人工边界方法应用到一类无界区域上的一维常系数电报方程初边值问题。我们首先引入适当的人工边界将问题限定在有限计算区域,随后利用Laplace变换以及一些基本的应用数学技巧,给出了该问题
当今经济全球化、区域间市场一体化的趋势依然没有改变,国际间投资和贸易的交流与合作依然是世界各国促进经济发展最有效的手段之一。中国始终坚持提升对外开放水平,构建良好营商环境,因此在吸引外商投资方面,就必须坚持包容开放的精神,推动投资自由化,促使外商投资能够在中国市场充分发挥其应有的作用,拉动经济持续增长,推动产业转型升级。建立和完善我国的外商投资国家安全审查是为引进外商投资设立底线,使得即能充分利用
胚胎干细胞有独特的能力,能自我更新,无限增殖,并分化或发育成多种类型的细胞和组织。胚胎干细胞应用到临床领域的关键问题是如何从其他类型的细胞中鉴定和分离出ES细胞。作为细胞的“身份证”,特异标志分子在胚胎干细胞识别和确定中发挥了重要作用。本论文中将从噬菌体肽库中筛选出的针对猕猴胚胎干细胞的特异多肽的DNA序列连接到pGEX-KG表达载体上,以便获得GST-peptides融合蛋白。同时,抽提大量培养
1906年1月,李叔同在日本编辑出版了综合性期刊《音乐小杂志》作为中国近代音乐期刊的起步,截至目前我国的音乐期刊发展道路已走过115年。1949年新中国的成立,使我国的社会制度发生了较大变革,文化思潮也随着社会环境的改变有了新的发展方向。上海作为当时国内现代化的城市,奥斯邦将中国第一座广播电台建立在上海并开始播音,这注定上海是近代中国广播事业最发达的城市。《广播歌选》作为曲谱类期刊,以广播为载体,