【摘 要】
:
随着社会的发展和通信与信息处理技术的不断进步,生物识别技术与民众的信息安全联系越发紧密。声纹识别作为生物识别技术的一种,受到越来越多的关注,被广泛应用到手机支付、智能终端、医疗服务以及刑事侦查等领域。但是由于声纹识别的研究较短,所以仍然有很多问题尚未解决。在提取说话人的声纹特征时噪声会使说话人语音频谱发生畸变。传统自然语言处理模型由多个步骤组成,每个步骤是一个独立任务,其结果好坏会影响下一个步骤,
论文部分内容阅读
随着社会的发展和通信与信息处理技术的不断进步,生物识别技术与民众的信息安全联系越发紧密。声纹识别作为生物识别技术的一种,受到越来越多的关注,被广泛应用到手机支付、智能终端、医疗服务以及刑事侦查等领域。但是由于声纹识别的研究较短,所以仍然有很多问题尚未解决。
在提取说话人的声纹特征时噪声会使说话人语音频谱发生畸变。传统自然语言处理模型由多个步骤组成,每个步骤是一个独立任务,其结果好坏会影响下一个步骤,从而影响最后的识别结果。本研究旨在对构建基于深度学习的系统的声纹识别方法进行深入研究。
通过对语音前端的语音增强算法分析,得出RLS算法更适合用于语音增强。针对传统RLS算法在非平稳环境下的突变和对时变语音信号的跟踪能力不够的问题,在传统RLS算法基础上提出一种基于可变遗忘因子的RLS算法。实验结果表明改进的RLS算法可以很好的抑制噪声对特征提取效果的影响。
针对目前语音处理流程由于多步骤、多模块造成误差累积导致识别精度下降问题,通过对比分析几种端到端模型的综合效果后,提出利用改进GE2E(GENERALIZED END-TO-END)模型进行优化特征提取。该算法在GE2E模型的基础上通过优化深度神经网络模型更好的利用输入层和输出层中每个节点相关的上下文关系,并使GE2E模型的复杂度下降。实验结果表明改进的GE2E模型可以很好地提高模型的识别性能,能够大幅减少训练时间。
其他文献
睡眠是人们生理活动中相对重要、不能缺少的一项,良好的睡眠质量是我们工作、生活和学习的一个重要保障。睡眠分期是睡眠研究的基础,可以帮助人们认识各个睡眠阶段特征和评估睡眠质量,而且对于睡眠相关疾病的诊断起到很大的作用。其中不同睡眠阶段中生理信号有不同的特征变化,所以生理信号常被用来进行睡眠分期,本文选用脑电信号(EEG)进行睡眠分期。目前阶段基于深度学习方法的睡眠分期研究已经趋于成熟,且比传统的方法准
汽车多媒体娱乐系统集视听娱乐、导航、通信、安全功能为一体,已成为目前汽车不可缺少的一个组成部分。传统的汽车多媒体娱乐系统采用单个核心主芯片,传递的信息量较少,且视频图像分辨率与刷新率较低,屏幕画面单调,已经无法满足驾驶员对高质量、全方位的车载影像系统的需求。因此如何研究设计一款具有更高性能的汽车影像系统,符合日益发展的市场需求,也是当前面临的实际问题。本课题基于某车载多媒体影像系统的软件设计项目,
滚动轴承在工业生产领域中应用广泛,并且实际生产中滚动轴承规格繁多,不同规格滚动轴承振动信号的故障频率之间存在很大差别,传统单一规格下的故障诊断方法直接应用于不同规格情况时错误率可能偏高。因此,以高准确率实现不同规格轴承故障诊断具有重大意义。本文提出两种方法用于解决不同规格滚动轴承故障诊断问题。提出一种基于深度条件对抗网络的不同规格滚动轴承故障诊断方法。该方法首先将滚动轴承一维振动信号转换为二维图像
随着人工智能的兴起,在医学图像处理方向上,数字医疗技术和智慧医疗技术开始步入医疗诊断系统中,应用计算机视觉技术取得了新进展。医学图像的信息丰富度和图片清晰度,一直是临床医生诊疗的关键判别依据。现有的医学成像方式未充分利用功能成像及解剖成像的优势,通过融合技术将两者有效结合,最大化的呈现患者病理信息,辅助医生诊断病情,有效弥补单一模态下医学图像信息缺失的缺陷。单模态的医学图像特征较简单,有效信息较少
随着工业4.0的到来,电子产品生产企业成为经济发展的重要组成部分,企业规模逐渐扩大,生产需求也随之提高。目前路径规划的效果还不够快速和精准,无法完全适应环境变化。蚁群算法以其较强的鲁棒性和优秀的寻路能力在AGV(自动引导车,Automated Guided Vehicle)路径规划问题上有广泛的应用前景。然而在实际设计过程中,基本蚁群算法非常容易陷入局部最优解,并且收敛速度缓慢。因此本文针对应用蚁
指纹识别技术是目前应用最广泛的身份验证方式,这项技术的核心在于如何精准快速的提取可靠且数量多的指纹特征。为解决主流的指纹方向场获取方法存在图像灰度极值区域纹线方向不可靠、平滑操作易导致细节点方向丢失和只提取单一方向场特征的问题,本文提出图形化指纹方向解析算法。本文方法不同于基于形态学操作获取指纹特征的算法,通过建立指纹图像和二维信号之间的联系,以信号解析为主线获取指纹方向场特征。主要研究内容如下:
目前钢板表面缺陷检测技术大多依靠人工目测和传统的机器视觉等方法完成。这些方法存在难以提取缺陷的本质特征、易受外界环境干扰等缺点,这些缺点导致检测精度受到影响。因此,本文研究基于深度学习的钢板表面缺陷处理技术。针对传统方法的缺点,本文引入VGG16网络模型并对其进行改进。首先在网络中加入通道注意力机制,以提高识别精度;其次采用深度可分离卷积替换网络中部分3×3卷积,以减少网络参数量和计算量,增加网络
近年来,随着全球化信息化的到来,产生了海量的数据,与此同时,频繁的数据交流和复杂的系统构建以及数据处理的时效性,对信息的网络传输和存储空间提出更高的要求,可见数据压缩在工业生产生活中越来越重要,数据压缩主要分为有损和无损压缩,其中无损压缩广泛应用于航天、医疗等技术领域。无损压缩中基于字典的压缩以自适应性强、复杂度低、编码效率高等被广泛利用,因此对无损压缩的算法研究具有十分重要的作用和意义。本文从数
当今社会基于人类特征提取的生物认证技术不断发展,说话人识别作为其中之一,是通过发音人的声音来辨别身份的。该生物认证技术也被叫做声纹识别,其核心内容是将语音样本信号中提取出的能代表发音人身份的信息进行处理进而实现对各类别说话人的识别。由于近年来生物认证方法在机器学习的推动下获得了巨大进展,有着广阔的发展前景和重要的研究价值,说话人识别也深受其影响,学者们逐渐从基于传统方法的说话人识别的研究方向转移到
随着指纹识别技术的应用越来越广,人们对其识别效率和准确性要求越来越高,而现实中受采集环境或自身皮肤状况影响仍存在大量低质量指纹图像无法得到有效识别。现有低质量指纹图像识别算法以图像增强为主,在一定程度上能减少伪细节点数目,但经过特征提取后仍会存在大量伪细节点,最终导致整个指纹识别系统的性能下降,使得及时、准确识别低质量指纹图像成为目前亟待解决的一个问题。本文提出一种低质量指纹图像识别算法,该算法主