基于多尺度频域特征和并行神经网络的说话人识别

来源 :南昌大学 | 被引量 : 0次 | 上传用户:xrp880823
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提取有效的声学特征对于提升说话人识别系统的性能至关重要,通常,频域特征可以通过梅尔滤波器组从语音信号中提取出来,并且通过改变梅尔滤波器组中的三角滤波器的个数,可以提取不同尺度的频域特征,这些特征所包含的说话人信息存在差异,所以不同尺度的频域特征之间存在互补特性。本文利用深度学习方法,主要研究了基于多尺度频域特征和并行神经网络的说话人识别方法。论文的主要工作如下:1.提出了一种基于多尺度频域特征和并行残差神经网络(Parallel Residual Neural Network,PRNN)的说话人识别方法。首先,通过改变梅尔滤波器组中三角滤波器的个数,从语音信号中提取两种不同尺度的频域特征,将其输入至并行残差神经网络的多层并行卷积层中,利用残差融合结构,融合所有并行卷积层的输出特征,得到融合特征,最后,将融合特征各维度的均值和标准差作为统计特征输入至全连接层和Softmax层,实现说话人识别。实验结果表明,基于多尺度频域特征和并行残差网络的说话人识别方法是有效的。2.提出了一种基于多尺度频域特征和混合门控并行卷积神经网络(Fusion Gate Parallel Convolutional Neural Network,FG-PCNN)的说话人识别方法。首先从语音信号中提取两种不同尺度的频域特征,并输入至混合门控并行卷积神经网络中的多层并行卷积层中,对于每个并行卷积层,利用混合门控机制从并行卷积层的输入特征中提取出两个门控权重矩阵,并将这两个门控权重矩阵分别加权在该并行卷积层的两个输出特征上。拼接最后一个并行卷积层的两个输出特征并输入至一层卷积层,提取融合特征,将融合特征各维度的均值与标准差作为统计特征输入全连接层和Softmax层,实现说话人识别。实验结果表明,基于多尺度频域特征和混合门控并行卷积神经网络的说话人识别方法是有效的,且使用混合门控机制可以提升基于并行神经网络的说话人识别系统的性能。
其他文献
花木兰作为中国“巾帼英雄”的典型形象,得到了全世界人民的不同解读。本文以迪士尼电影《花木兰》为例,以文化差异角度、语言因素及心理因素角度来分析电影带来的跨文化传播障碍现象,并解释跨文化传播障碍的产生原因,最终得出相应的跨文化传播障碍应对策略。旨在引导文艺工作者及跨文化传播者培养正确的跨文化传播意识,将真正的中国好故事,传向青年、传向世界。
期刊
任务数据语义知识是任务驱动的遥感数据检索的基础,其由时间、空间、任务、遥感数据产品、方法与效果实体六个元素组成。学术图谱的文本中含有丰富多样的任务数据语义知识,对其进行标注是从文本中自动化获取任务数据语义知识的前提。因此如何设计面向学术图谱的任务数据语义知识文本的标记语言、制定其标注规范以及提高标注速率对获取大规模任务数据语义知识具有重要意义。本文以学术图谱中的文本作为数据源,构建了任务数据语义知
学位
随着电磁频谱机动作战理念的发展,雷达和通信系统对带宽和频谱资源的需求越来越高,传统单一功能的电子作战装备已经无法适应这种需求,使得现有的雷达系统与无线通信系统的共存变得越来越迫切,雷达通信一体化技术成为了一种发展趋势。雷达通信一体化中一种有效可行的实现方案是对空域发射技术进行设计,以将通信作为雷达的第二功能。这里所谓的空域发射技术设计主要是指通过形成特定的空域发射方向图,利用方向图的主瓣实现雷达的
学位
随着腔光力学的不断深入研究,复合腔光力系统得到越来越多的青睐。与典型光力系统相比,复合腔光力系统不仅可以将不同物理系统的独特优势结合起来,还可以用来揭示更多新奇的量子光学现象,并且具有更广泛的应用前景。例如,在光信号对机械振子调控方面,通过研究系统的吸收色散特性,可以实现对光力诱导透明、光力诱导吸收、光力诱导放大、快慢光以及简正模劈裂等现象的调控;在研究机械振子的量子调控方面,由于腔光力系统具有较
学位
近年来,移动互联网技术不断发展,已成为用户工作、生活中不可或缺的一部分。物联网接入设备数量的大幅增加以及用户对于无线通信传输速率和服务质量的要求越来越高,使得频谱资源变得的日益紧张。非正交多址接入(Non Orthogonal Multiple Access,NOMA)技术的应用允许用户共享频谱资源,有效提高了频谱资源的利用率及系统的吞吐量。但日益成熟的5G通信技术相较于4G通信技术而言,通信频率
学位
随着无线通信技术的飞速发展,无线网络的安全问题越来越受到公众的重视,但是基于无线网络的开放特性,恶意通信用户也能够正常接入无线通信网络进行非法信息传输。因此,对无线通信网络中可疑通信链路进行主动监听,已经成为监控和打击违法犯罪活动的重要手段。得益于无人机(Unmanned Aerial Vehicle,UAV)灵活部署、高机动性和良好视距(Line of Sight,Lo S)链路等优势,基于无人
学位
在数字图像的传输过程中,数字图像(如与军事、医疗、人脸相关的数字图像等)可能携带需要防止泄漏的敏感信息。因此,数字图像信息的安全是非常重要的。为了确保数字图像信息的安全,可以使用图像加密、图像水印和图像隐写等技术。图像加密在信息传输的过程中发挥着重要作用,它是将原始图像转换为视觉上无意义的表示。目前,深度学习已经在各个领域得到了广泛应用,本文提出了两种基于深度学习与混沌系统的图像加密算法。主要研究
学位
无线电能传输(Wireless Power Transfer,WPT)作为一种新型的供电方式,有着安全、便捷、高效等优点,广受研究和市场青睐。负载无关恒压(Constant Voltage,CV)输出或恒流(Constant Current,CC)输出是无线电能传输(WPT)的重要应用场景。在多负载WPT系统中,充电设备不止一个、充电需求不止一种、充电时充电设备会频繁的移入和移除。因此,为了应对W
学位
正交频分复用(OFDM)波形外辐射源雷达是一种通过被动接收非协作方发射的OFDM波形信号来对目标进行跟踪或定位的双/多基地雷达。然而,此雷达的目标信息提取过程面临着弱目标被同时接收到的直达波和多径回波所淹没的问题。针对这一问题,传统信号处理方法利用雷达回波数据的稀疏性、基于压缩感知重构算法来提取弱目标信息,但这些方法需要人工设置基矩阵和正则化参数等。随着人工智能的崛起和迅速发展,许多学者开始结合深
学位
随着人工智能和工程设计等诸多领域的发展,与之相关的优化问题也越来越复杂。因此,许多先进的群智能算法被用来解决优化问题,其中具有高灵活性和强适应性的粒子群优化算法是改进大多数优化算法的基础。然而,传统的粒子群优化算法在复杂的高维优化问题中的搜索性能较差,在迭代的过程中无法更新群体样本,使种群更容易处于局部最优状态。结合量子信息理论,研究人员对量子粒子群优化算法展开了研究。本文以现有的量子粒子群优化算
学位