基于SVM和深度学习的说话人识别研究

来源 :昆明理工大学 | 被引量 : 1次 | 上传用户:andalee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的不断发展,说话人识别技术作为一种重要的身份认证方法受到了越来越多的关注,传统的说话人识别技术通常以MFCC、LPCC等作为特征参数,识别算法采用隐马尔科夫模型、矢量量化和高斯模型等方法,但说话人识别技术在识别精度、可识别样本量及识别速度上还有待进一步提高。本文主要研究了以下几方面的内容:(1)详述了说话人识别的模型和原理对语音预处理阶段进行了详细的研究,论述了预处理阶段每一步的工作,针对MFCC等一系列参数的具体计算过程进行了介绍,然后对主流说话人识别方法进行了研究,探究四种不同的说话人识别模型,对主流方法所存在的局限性进行了证实。(2)提出了改进的基于支持向量机和梅尔倒谱系数的说话人识别方法在特征提取方法中采用Mel频率倒谱系数的同时,针对语音特征参量进行了改进,在传统特征量的基础上增加了四种改进的音频特征参数,然后对SVM模型进行核函数种类和参数的对比实验,并且通过实验仿真结果表明,本文改进过的说话人识别系统的识别率较之前提升了21%。(3)研究了基于深度学习和语谱图的说话人识别系统本文将说话人语音信息整体作为特征参量输入,保留最原始信息参数,将说话人的语音信号处理为二维的语谱图,规整格式后作为输入,并对语谱图进行处理得到不同的声纹图,将其与卷积神经网络连接,构建说话人识别系统,测试系统性能,识别率可达91.2%。
其他文献
随着技术的进步,新能源发电在能源的占比越来越大。虽然现在不可再生能源的发电占比依然很高,新能源要替代不可再生能源是个长期的过程,在这段时间内如何有效提高新能源的利用以及不可再生资源和新能源的协调调度优化是个极其重要的问题。越来越多的新能源发电并网,火电和风电如何协调发电成为电力调度方面必须解决的问题。根据社会需求和环境背景,在保证电网安全运行的前提下,将多目标设为发电总成本和火电机组波动量。本文改
习本以地方财政计划作为地方政府预算的中心环节,并将地方税返还制度列入该计划,以保障和调整地方财源,满足地方公共支出需要。针对目前出现的地方财力不足,以及中央财政对地方财
当前,我国书展已逐步融合图书订货与销售、版权交易、信息交流、形象展示等功能为一体。书展作为纽带,可为出版社、作者及读者间提供交流的平台,激发书香社会巨大的"场效应"。
通过过一硫酸和丙酮反应,合成了新型高效的氧化剂二甲二氧环烷。其光谱数据和理化性能与文献报道一致,制得的氧化剂应用于一系列天然化合物的碳碳双键环氧化反应,取得较好结
针对现有铁路货运量预测方法存在较大突变性误差的问题,提出经济周期阶段参数的概念,将经济周期量化后作为一个输入因素提供给神经网络模型,用以学习记忆经济波动情况,建立基
目的研究自噬在敌敌畏(O,O-dimethyl-O-2,2-dichlorovinylphosphate,DDVP)所致神经毒性中的作用与机制,观察DDVP对SK-N-SH细胞氧化损伤作用,研究细胞氧化损伤蛋白的降解去路,
京津冀协同发展是党和国家作出的一项重大战略决策。交通一体化发展是京津冀协同发展需要率先突破的重点领域和先行领域。秦皇岛市交通运输部门紧紧围绕京津冀协同发展战略和
木霉菌是一种重要的植物病害生防菌,可产生多种具有生物活性的代谢产物。以哈茨木霉(rdchoderma harzianum)NF9和绿木霉(Trichoderma virens)TY这2株木霉菌株为对象,研究其产生的代
亳州是一座历史悠久的文化名城,城市代表戏曲剧种二夹弦(非物质文化遗产剧种)同样具有独特的地方特色。本文从二夹弦的历史背景、二夹弦的形成与发展及其艺术特征作了简扼的
随着互联网快速高效的发展,大数据、云计算的兴起,电子商务领域越来越注重个性化推荐,这不仅是因为物质生活水平的不断提升使得人们越来越追求精神上的满足,还因为个性化推荐系统能实现用户、系统平台和生产商“三赢”的局面。本文对推荐系统的发展现状以及相关推荐技术进行了研究,考虑到传统推荐算法中未涉及对用户特征的研究,且用户/项目评分矩阵数据稀疏严重难以解决,而用户特征在很大程度上对用户的兴趣爱好模型起决定性