灰狼算法优化的核极限学习机在说话人识别中的应用研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户：UsherChen2431

【摘要】

：

当今社会基于人类特征提取的生物认证技术不断发展,说话人识别作为其中之一,是通过发音人的声音来辨别身份的。该生物认证技术也被叫做声纹识别,其核心内容是将语音样本信号中提取出的能代表发音人身份的信息进行处理进而实现对各类别说话人的识别。由于近年来生物认证方法在机器学习的推动下获得了巨大进展,有着广阔的发展前景和重要的研究价值,说话人识别也深受其影响,学者们逐渐从基于传统方法的说话人识别的研究方向转移到

【作者】

：

王琪

【机构】

：

哈尔滨理工大学

【出处】

：

哈尔滨理工大学

【发表日期】

：

2021年09期

【关键词】

：

说话人识别

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当今社会基于人类特征提取的生物认证技术不断发展，说话人识别作为其中之一，是通过发音人的声音来辨别身份的。该生物认证技术也被叫做声纹识别，其核心内容是将语音样本信号中提取出的能代表发音人身份的信息进行处理进而实现对各类别说话人的识别。由于近年来生物认证方法在机器学习的推动下获得了巨大进展，有着广阔的发展前景和重要的研究价值，说话人识别也深受其影响，学者们逐渐从基于传统方法的说话人识别的研究方向转移到基于机器学习方法的说话人识别中来。
　　本文提出了一种基于灰狼算法优化的核极限学习机应用于说话人识别的方法，通过选取合适的语音样本数据集，提取数据集中的声音特征并进行降维，将降维之后的数据集置于灰狼算法优化的核极限学习机模型中进行训练。最后，将测试样本作为训练后系统的输入，进行匹配计算、结果比对。
　　首先，进行语音样本数据的采集，选择15名实验者在安静的环境下进行每人30～40条语音数据的采集工作，并将采集到的语音样本数据统一处理为9秒左右的WAV格式文件，为了降低说话人识别系统的复杂度，将得到的数据进行特征处理，为说话人身份的识别提供了真实的实验数据。
　　其次，将经过特征处理后的语音样本数据集分为两类，一类作为训练集用于说话人识别系统的学习，一类作为测试集用于比较说话人身份的识别结果。提出了极限学习机模型后，又通过公式推导和理论分析详细研究了核极限学习机模型，通过对一组随机样本数据进行识别，并且在识别中选取不同的传统机器学习方法进行了对比实验，表明了核极限学习机的训练速度和准确率远远优于传统机器学习方法。
　　最后，为了追求更好的识别准确率，引入了群智能优化算法中的灰狼优化算法，实验结果表明，基于灰狼算法优化的核极限学习机在识别精度和收敛速度方面优于其他群智能算法优化的网络模型，并在灰狼算法的迭代优化中寻求最优解，使一次实验中对于说话人识别的最大识别准确率为94.76％，平均识别准确率为93.17％，且各类别说话人的声音辨别准确率均在85％以上，结果说明了改进后的网络模型相比核极限机网络模型有更好的识别精度，表明了基于灰狼算法优化的核极限学习机网络模型有更好的分类特性，验证了本文所提出的基于灰狼算法优化的核极限学习机网络模型在说话人识别应用中的良好发展前景。

其他文献

基于注意力机制+DenesNet的肺部X光图像分类算法

随着新冠疫情的全球性蔓延,人们对于肺部疾病也愈加关注。肺部疾病种类繁多,肺炎、气胸、肿块等都是目前比较严重的肺部疾病。在肺部病变的检测方面,X射线是目前比较常见的诊断方法,但由于肺部X光图像的影像灰雾现象,肺部病变区域重叠等问题给医生诊断肺部疾病造成了一定程度的影响。随着科学技术的成熟与进步,计算机医疗辅助系统应运而生,它对于帮助医生提高肺部疾病诊断的精度以及速度起到了一定的作用。因此,针对肺部X

学位

X光图像

低压大电流整流模块传导干扰的分析与抑制

随着社会和电力电子技术的快速发展,低压大电流电源在船舶、航天和工业领域有着非常广泛的应用前景。PWM整流模块作为低电压大电流电源的关键部件,其高速工作的开关器件MOSFET成为模块产生电磁干扰的主要干扰源。电磁干扰的超标不仅会缩短整流模块自身和周围电子设备的寿命,严重时会导致其性能下降,甚至将其毁坏,而且还会影响长时间和设备接触的人体的健康。因此,本文以低压大电流电源中PWM整流模块为载体,研究其

学位

低压大电流电源

基于脑电信号的深度学习睡眠分期研究

睡眠是人们生理活动中相对重要、不能缺少的一项,良好的睡眠质量是我们工作、生活和学习的一个重要保障。睡眠分期是睡眠研究的基础,可以帮助人们认识各个睡眠阶段特征和评估睡眠质量,而且对于睡眠相关疾病的诊断起到很大的作用。其中不同睡眠阶段中生理信号有不同的特征变化,所以生理信号常被用来进行睡眠分期,本文选用脑电信号(EEG)进行睡眠分期。目前阶段基于深度学习方法的睡眠分期研究已经趋于成熟,且比传统的方法准

学位

睡眠分期

基于FPGA的车载影像系统研究与设计

汽车多媒体娱乐系统集视听娱乐、导航、通信、安全功能为一体,已成为目前汽车不可缺少的一个组成部分。传统的汽车多媒体娱乐系统采用单个核心主芯片,传递的信息量较少,且视频图像分辨率与刷新率较低,屏幕画面单调,已经无法满足驾驶员对高质量、全方位的车载影像系统的需求。因此如何研究设计一款具有更高性能的汽车影像系统,符合日益发展的市场需求,也是当前面临的实际问题。本课题基于某车载多媒体影像系统的软件设计项目,

学位

多媒体影像系统

不同规格滚动轴承故障迁移诊断方法研究

滚动轴承在工业生产领域中应用广泛,并且实际生产中滚动轴承规格繁多,不同规格滚动轴承振动信号的故障频率之间存在很大差别,传统单一规格下的故障诊断方法直接应用于不同规格情况时错误率可能偏高。因此,以高准确率实现不同规格轴承故障诊断具有重大意义。本文提出两种方法用于解决不同规格滚动轴承故障诊断问题。提出一种基于深度条件对抗网络的不同规格滚动轴承故障诊断方法。该方法首先将滚动轴承一维振动信号转换为二维图像

学位

滚动轴承

基于深度卷积神经网络的医学图像融合算法研究

随着人工智能的兴起,在医学图像处理方向上,数字医疗技术和智慧医疗技术开始步入医疗诊断系统中,应用计算机视觉技术取得了新进展。医学图像的信息丰富度和图片清晰度,一直是临床医生诊疗的关键判别依据。现有的医学成像方式未充分利用功能成像及解剖成像的优势,通过融合技术将两者有效结合,最大化的呈现患者病理信息,辅助医生诊断病情,有效弥补单一模态下医学图像信息缺失的缺陷。单模态的医学图像特征较简单,有效信息较少

学位

医学图像融合

电子元器件仓库的物料输送路径算法研究

随着工业4.0的到来,电子产品生产企业成为经济发展的重要组成部分,企业规模逐渐扩大,生产需求也随之提高。目前路径规划的效果还不够快速和精准,无法完全适应环境变化。蚁群算法以其较强的鲁棒性和优秀的寻路能力在AGV(自动引导车,Automated Guided Vehicle)路径规划问题上有广泛的应用前景。然而在实际设计过程中,基本蚁群算法非常容易陷入局部最优解,并且收敛速度缓慢。因此本文针对应用蚁

学位

路径规划

图形化指纹方向解析算法研究与实现

指纹识别技术是目前应用最广泛的身份验证方式,这项技术的核心在于如何精准快速的提取可靠且数量多的指纹特征。为解决主流的指纹方向场获取方法存在图像灰度极值区域纹线方向不可靠、平滑操作易导致细节点方向丢失和只提取单一方向场特征的问题,本文提出图形化指纹方向解析算法。本文方法不同于基于形态学操作获取指纹特征的算法,通过建立指纹图像和二维信号之间的联系,以信号解析为主线获取指纹方向场特征。主要研究内容如下:

学位

指纹识别

基于深度学习的钢板表面缺陷处理技术研究

目前钢板表面缺陷检测技术大多依靠人工目测和传统的机器视觉等方法完成。这些方法存在难以提取缺陷的本质特征、易受外界环境干扰等缺点,这些缺点导致检测精度受到影响。因此,本文研究基于深度学习的钢板表面缺陷处理技术。针对传统方法的缺点,本文引入VGG16网络模型并对其进行改进。首先在网络中加入通道注意力机制,以提高识别精度;其次采用深度可分离卷积替换网络中部分3×3卷积,以减少网络参数量和计算量,增加网络

学位

钢板缺陷检测

一种改进的LZW--FSE数据压缩算法研究

近年来,随着全球化信息化的到来,产生了海量的数据,与此同时,频繁的数据交流和复杂的系统构建以及数据处理的时效性,对信息的网络传输和存储空间提出更高的要求,可见数据压缩在工业生产生活中越来越重要,数据压缩主要分为有损和无损压缩,其中无损压缩广泛应用于航天、医疗等技术领域。无损压缩中基于字典的压缩以自适应性强、复杂度低、编码效率高等被广泛利用,因此对无损压缩的算法研究具有十分重要的作用和意义。本文从数

学位

数据压缩

灰狼算法优化的核极限学习机在说话人识别中的应用研究

与本文相关的学术论文