【摘 要】
:
最近几年,人工智能发展迅猛,人们对机器的需求也随之提高,期望机器能够像人一样具有情感。语音作为人与人之间的重要沟通方式,不仅仅传达了语义信息,而且表达了丰富的情感状态信息,因此研究语音中的情感具有重要的意义,能够有效帮助人类与机器之间实现更加自然流畅的交互。本文基于卷积循环神经网络进行了语音情感识别的研究,主要包括以下三个方面:针对情感语音数据库,提取语音信号中能够表现情感状态的特征,主要包括韵律
论文部分内容阅读
最近几年,人工智能发展迅猛,人们对机器的需求也随之提高,期望机器能够像人一样具有情感。语音作为人与人之间的重要沟通方式,不仅仅传达了语义信息,而且表达了丰富的情感状态信息,因此研究语音中的情感具有重要的意义,能够有效帮助人类与机器之间实现更加自然流畅的交互。本文基于卷积循环神经网络进行了语音情感识别的研究,主要包括以下三个方面:针对情感语音数据库,提取语音信号中能够表现情感状态的特征,主要包括韵律学特征、音质特征和谱相关的特征,然后对这些特征应用统计函数,获取其统计特征,最后将所有的特征在特征维度上进行组合,得到二维的特征矩阵,并将此特征矩阵用作模型训练。以提取的特征作为模型输入,研究了基于注意力机制的循环神经网络对语音情感的识别。首先基于该模型讨论了训练集样本长度对语音情感识别率的影响,当训练集样本长度为180帧时,模型的识别准确率最高;然后以180帧作为训练集样本长度,分别在循环神经网络模型和带有注意力机制的循环神经网络模型上进行语音情感识别。经过实验表明,本文中使用基于注意力机制的循环神经网络进行四种情感识别时,相对于只使用循环神经网络,模型性能提升了6.51%;而且在两种情感识别中,该模型的识别准确率得到了显著的提升。因此本文提出的特征组合与注意力机制模型在语音情感识别方面具有显著的效果。结合卷积神经网络和循环神经网络的结构特性,提出了一种综合的网络模型,并使用该网络模型进行语音情感识别。首先结合卷积神经网络和循环神经网络的特性设计了一种综合的网络结构,并将此网络结构称为卷积循环神经网络,然后使用本文提取的特征作为输入并对此网络模型进行训练;与此同时讨论了训练样本的长度对模型的语音情感识别准确率的影响,当训练样本的长度为140帧时,模型的情感识别准确率达到最高;最后将140帧作为训练集样本长度并使用卷积循环神经网络作为模型对语音情感进行识别。实验结果表明,当使用本文提出的64维特征作为输入的卷积循环神经网络模型对四种情感类别的语音进行识别时,模型的识别准确率达到了85.71%,而使用46维特征作为输入的卷积神经网络模型的识别准确率为77.00%,相比之下,本文提出的网络模型的情感识别准确率提升了8.71%;并且在两种情感识别时,本文提出的模型的情感识别率较单用卷积神经网络也有比较明显的提升。综上本文提出的特征组合与卷积循环神经网络模型在语音情感识别中效果显著。
其他文献
重型车辆因其体积结构较大,当车辆遇到突发路况、紧急转弯或者更换车道时,极容易发生车辆侧翻事故,造成重大人员伤亡与经济财产损失。近年来,侧翻预警及控制系统不断的深入研究,提高了重型车辆在侧翻预警控制的及时性与准确性。本文针对重型车辆侧翻预警及控制系统进行研究,并进行如下几个主要方面的工作:1)通过TruckSim软件,结合车辆数据参数搭建重型车辆的仿真模型;为了研究更贴近实际路况,建立三维路面激励模
随着以物联网、无线传感器网络和人工智能为基础的第四次工业革命的到来,传统能源的衰竭及高污染性使得人们对新型能源的需求与日俱增,人们对于大量的、分布式的、微型的无线电源有着巨大需求。而机械能是分布最广泛的能量形式之一,可以满足这些需求的纳米发电机前景远大,并以其环境友好、柔性易集成的特点为诸多学者研究。纳米发电机中的摩擦纳米发电机是将摩擦起电原理及静电感应相结合制备出的发电机,其理论基础源于麦克斯韦
随着新一代飞机的轻量化要求和液压系统工作压力的增高,飞机液压管路的振动问题也更加显著,对飞机的可靠性和安全性造成重大影响,故而对于液压管路的振动分析具有重要意义。目前,有众多学者针对特定液压管路对象进行了振动分析和参数化建模研究,但是飞机液压系统的管路数量庞大且附件类型众多,常规的有限元分析手段难以进行大量液压管路的分析校核工作。针对上述问题,本文研究了飞机液压分支管路参数化建模的自动化实现方法,
硅基光电子学的发展为解决目前集成电路所面临的量子效应等问题提供了新方向。但由于衍射极限的存在,传统光电器件的尺寸难以缩小到与微电子器件相同量级的尺度范围内,这严重制约了光电器件集成度的提高。表面等离激元是沿着导体-介质界面方向传播的倏逝电磁波,其可以突破衍射极限,将光波场紧密限制在金属表面,是实现具有亚波长限制光电器件的有效手段。石墨烯是具有诸多优异特性的新型低维材料,石墨烯表面等离激元相比金属表
在云计算技术日益发展的今天,医疗系统中的数据也日益电子化,依托于云环境高效的存储与计算环境,给数据使用者带来了很大的便利,但是与此同时安全隐患也日益增大,尤其是对于医疗数据这一类非常隐私的数据更是如此。对电子医疗数据安全性的提高目前已经有了很多研究,比如使用快捷安全的加密算法或是设计安全的访问控制系统,但是要考虑到系统的安全性、处理速度的快捷以及系统未来的扩展则很难。本文主要从访问控制策略的角度出
现代战场环境日益复杂,为雷达的精确制导带来了巨大的挑战,传统的窄带雷达已经逐渐无法满足复杂地面场景作战要求,需要使用分辨率更高的宽带体制雷达对目标进行高分辨成像来获取更丰富的目标信息。一方面,宽带体制雷达中目标不再呈现为一个点目标,传统的窄带恒虚警检测算法将不再适用,对于高效的宽带雷达目标检测算法的需求迫切,并且极化体制雷达的发展增加了目标极化维信息,目标的极化信息为提高检测算法性能提供了新的途径