基于倒谱系数特征的合成语音智能检测技术研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:zhi911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成技术的迅猛发展对自动说话人验证系统构成了威胁。为了提高自动说话人验证系统的安全性,我们需要研究如何鉴别自然语音和合成语音。本文在分析现有合成语音检测技术的基础上,研究了基于倒谱系数特征的合成语音检测技术。论文的主要研究工作如下:1.提出了基于Gammatone频率修正群延时倒谱系数(GFMGDCC)的合成语音检测算法。该方法对语音信号提取GFMGDCC特征,并使用长短时记忆(LSTM)分类器进行分类来鉴别自然语音和合成语音。实验在三种不同类型的合成语音中对比了本文提出的GFMGDCC、反梅尔频率修正群延时倒谱系数(IMFMGDCC)和反Gammatone频率修正群延时倒谱系数(IGFMGDCC)以及已有的梅尔频率修正群延时倒谱系数(MFMGDCC)共四种特征,分别在卷积神经网络(CNN)、LSTM分类器下对合成语音的检测性能。实验结果表明,本文使用的基于GFMGDCC特征的检测算法对于合成语音的检测效果良好,获得了较好的检测性能。2.本文还提出了一种基于修正群延时倒谱系数(MGDCC)和常量Q倒谱系数(CQCC)的合成语音检测算法。该方法以MGDCC-CQCC组合特征作为语音的提取特征,并结合CNN和LSTM网络的特点,使用CNN-LSTM作为分类器进行分类检测。采用三种不同类型的合成语音进行实验,对比了提出的MGDCC-CQCC特征以及MGDCC、CQCC特征分别在CNN、LSTM和CNN-LSTM分类器下对合成语音的检测性能。实验结果表明,本文提出的基于MGDCC-CQCC的合成语音检测算法获得了良好的检测性能,尤其在检测拼接合成语音时效果显著,等错误率EER能降低到2.65%。
其他文献
目的:基于介孔二氧化硅纳米颗粒(Mesoporous silicon nanoparticles,MSNs)构建装载miR-26a的载体系统,对该载体系统进行表征并研究其对大鼠骨髓间充质干细胞(Rat bone marrow mesenchymal stem cells,rBMSCs)成骨分化的影响。方法:使用聚乙烯亚胺(Polyethylenimine,PEI)将miR-26a封装在MSN的介孔
近几年来,我国学生体质健康的问题已经成为家庭、学校、社会关注的热点。在课程改革背景下,分析学生体质与学校体育现状,提出改善学校体育工作以提高学生体质健康水平的办法尤为重要。本研究以宏庙小学学生体质健康和体育特色设置为研究对象,通过文献资料法、专家访谈法和问卷调查法等研究方法对宏庙小学体育特色现状及学生体质现状进行调查与分析,探讨宏庙小学体育工作与学生体质的现状,以期寻找切实有效的办法来改善学校体育
海淀区作为北京市基础教育阶段办学规模最大的区,在学校体育竞赛工作方面拥有丰富的资源,体育竞赛活动作为海淀区学校体育工作的重点之一,其中非常重要的一项工作就是成为学校体育教育的大区、强区,力争通过开拓前瞻的工作探索,发挥更大的示范引领作用。学校体育竞赛活动的完善和发展也呈现出新的态势,在原来仅有体育传统校的基础上新增了足球特色校、冰雪特色校,在经费和政策上给予了很大支持,使得学校参与区级体育竞赛活动
我国在获得2022年冬季奥运会举办权之后,滑雪产业的升级成为不可逆的历史潮流。而在滑雪产业的全产业链条中,大型滑雪旅游度假村是产业发展的主力,是产业升级的关键环节,处于核心与引领地位,故大型滑雪旅游度假村在这其中应承担重要的历史责任。但我国目前滑雪旅游度假村仍处于“小作坊式”分散经营的局面,且经营活动主要集中于冬季,人才流失严重等问题严重,无论在宏观产业规模还是微观企业效益上都落后于国际滑雪产业强
葡萄糖的浓度可用以衡量人体的代谢程度,是评价人体健康与否的重要指标。对葡萄糖含量的定量测量在生物化学、食品分析和临床化学等领域具有十分重要的意义。将光刻与热解技术结合的碳微机电系统工艺是低成本制备碳结构的有效方法,可获得具有宽的电化学稳定窗口、良好的生物兼容性和导电性的碳微纳结构。碳微纳结构因其大的有效表面积,可缩短电子扩散距离,在能量存储器件和生物传感器等领域表现出巨大的潜力。本文在研究悬浮光刻
由于无线信号传输时可能存在障碍物影响,致使信号最终通过反射或者折射的方式到达接收端。反射和折射的传播方式不仅会造成接收信号到达时间(TOA,time of arrival)大于发送端到接收端的直线距离传输时间,而且信号到达角度(AOA,angle of arrival)也与直线传播到达角度不同。将无线信号非直线距离传播的方式定义为非视距(NLOS,non-line-of-sight)传播,同时,由
随着通信技术的发展,WiFi产业链逐渐成熟,WiFi设备和产品的成本开始降低,WiFi迎来了新的发展机遇:尤其是在一些偏远地区,受蜂窝网络基站成本因素影响,小区宽带接入和数据回传等业务成为了一个不小的难题,而WiFi凭借低成本的优势脱颖而出,在这些应用场景中得到了人们的关注。机遇往往伴随着挑战,在这些应用场景中,对WiFi网络提出了更高的要求,例如,需要WiFi网络提供更远的传输距离,更小的链路抖
无线保真(Wireless Fidelity,Wi-Fi)是新技术时代最伟大的成功技术应用案例之一,其带来的社会效益为世界大多数人所熟知。Wi-Fi能使人们的相互交流和娱乐更加便捷,并在全球范围内创建了新的技术、提供了新的职业。由Wi-Fi带来的经济价值令人叹为观止,Wi-Fi已成为人们生活必不可少的一部分,并且是企业和运营商网络的关键互补技术,因此,对于IEEE的802.11系列的未来技术和发展
近年来机器学习技术取得了长足的发展,成为诸多软件的创新驱动力,其质量与可靠性问题正逐渐引起人们的高度关注。软件测试是保障软件质量的重要手段,将软件测试技术应用于机器学习软件的质量保障与评估具有重要研究价值。而区别于传统软件,机器学习软件一般规模庞大、结构复杂;软件行为具有不确定性,预期输出难以构造;其数据驱动特性和内部行为分析方法的缺失使得其往往被当作无法解释的黑盒。因此,传统软件测试技术难以直接
在现代游泳竞技比赛中,只有把游泳速度力量分配控制好,才能够展现出比较完美的竞技水平以及优异的成绩。所以,设计出一种游泳项目训练速度诱导仪,在游泳项目训练中作为辅助训练器材使用,对提高游泳运动员的竞技水平具有积极意义。而且为我国游泳这项竞技运动增添更多的科技因素,可以促进我国游泳运动的科学发展,对缩小与世界上游泳项目传统大国如澳大利亚、美国等国家之间的差距有着重要意义。运用游泳项目训练电子速度诱导仪