基于特征研究与多输出BLSTM的语音情感识别技术研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户：chenhua99

【摘要】

：

语音不仅传达着语义信息而且也传达着情感信息。计算机使它的使用者能够通过自然的交互,高效高质量地完成既定的任务。随着语音情感挖掘工作的不断发展,对社会服务、医学、安全、工业控制等相关领域都有实际的应用,但是由于情感定义的不确定性和缺乏统一的建立标准的数据库以及情感特征的模糊性,使得语音情感识别技术成为了一个难题,还存在许多有待攻克的难关。为了解决语音情感识别中识别率不高和还不能做到迁移学习且鲁棒性较

【作者】

：

王艳

【机构】

：

广西师范大学

【出处】

：

广西师范大学

【发表日期】

：

2019年01期

【关键词】

：

语音情感识别

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音不仅传达着语义信息而且也传达着情感信息。计算机使它的使用者能够通过自然的交互，高效高质量地完成既定的任务。随着语音情感挖掘工作的不断发展，对社会服务、医学、安全、工业控制等相关领域都有实际的应用，但是由于情感定义的不确定性和缺乏统一的建立标准的数据库以及情感特征的模糊性，使得语音情感识别技术成为了一个难题，还存在许多有待攻克的难关。为了解决语音情感识别中识别率不高和还不能做到迁移学习且鲁棒性较差等难题，本文进行以下几方面的改进：
　　1.提出改进的MFCC特征，EEMFCC和F0MFCC。将韵律特征和谱特征结合，提取改进的MFCC特征。实验中应用改进的MFCC特征，EEMFCC和F0MFCC与传统特征的组合特征，采用SVM为识别方法，在EMODB库上得到85.59％的识别率，比没加入这两种改进的MFCC特征增加了2.68％，在EMODB库上得到的识别效果良好。但由于组合特征的融合特征冗余性高，时效性不好，而且从实验结果来看，‘快乐’识别率并不是很高，最高识别率为54.17％，实验并没有有效提高‘快乐’的情感识别率，所以实验选用的特征仍然存在不足之处，特征的有效性和鲁棒性仍然有改进的空间，所以本文还进行了特征的优选实验。
　　2.针对‘快乐’情感识别率低和特征冗余性高的问题，希望通过选择合适的特征组合来提高识别率。用BP算法进行特征选择，实验中为了挑选出对网络贡献较大的特征，通过对输入节点信号变化的敏感度来度量特征的重要性。选取出有效没有冗余的特征送入到分类器里。实验中应用经过特征优选后的特征，采用SVM为识别方法，在EMODB库上得到85.66％的识别率。通过BP特征选择算法，进行特征优化，降低了特征的冗余性，仅应用8个特征就达到略优于前一节的组合特征的识别结果，提高了识别效率，在传统识别算法里取得良好的识别效果，说明该组特征的有效性。但从实验结果来看，‘快乐’识别率仍然为54.17％，特征优化实验没能改善‘快乐’情感的识别率。EMODB库的混淆矩阵‘快乐’类情感都偏低，其和‘愤怒’高混，由于其言语表达速度快，音调表现力强，力度强等原因。所以实验选用的分类算法还是存在不足，要引入更适合语音情感识别领域的分类算法，进一步引入多输出BLSTM网络模型，以此来获得更好的识别结果和更好的鲁棒性可迁移性。
　　3.由于LSTM结构充分利用了语音的时序信息，同时通过双向LSTM，即BLSTM反向时序信息也被提取出来。而且从ResNet的跨层连接得到启发，考虑到LSTM不同层都有输出，如果结合在一起，特征能更充分的利用。输出BLSTM多层信息，BLSTM的每一层特征相加融合，实际上是用低层网络信息补充高层网络信息，以此达到良好的识别结果。在特征优化的基础上，提取111维70帧/段的段特征，应用多输出BLSTM网络模型，得到良好的识别效果。即在特征优化的基础上，应用111维70帧/段的段特征和三层六输出BLSTM的识别方法，在EMODB数据库上得到WA为91.17%，UA为89.79%的识别率，识别效果良好，本文在EMODB库的识别率与目前最前沿的研究成果处于相当水平。并在多库和混库上验证优选特征和分类模型的有效性和鲁棒性。
　　

其他文献

基于IEDG的局部变化问题高效求解算法研究

目标发生局部变化后电磁散射问题的快速求解,一直是计算电磁学领域面对的重要的实际问题之一。本文以矩量法中的局部变化算法为基础,以扩展局部变化算法的灵活性和进一步降低局部变化算法的计算复杂度为目标进行了深入的研究。主要研究工作如下:1.利用不连续伽略金积分方程法扩展了局部变化算法的灵活性。不连续伽略金积分方程法通过强加电荷惩罚项和电势惩罚项,保证了不匹配网格上的电流连续性,从而简化了局部变化算法在处理

学位

抗旁路攻击的紧凑型SM4加解密电路研究与设计

密码算法作为一种保证数据安全的手段广泛应用在物联网等领域的安全系统中,其硬件实现及旁路攻击防御一直是信息安全领域的研究热点。随着密码电路成为国产替代战略的重要组成部分,SM4作为我国官方公布的首个对称密码算法,已经越来越多的应用在国内信息安全的各个领域。由于某些领域如物联网节点及智能卡对密码电路的面积开销极其敏感,因此研究与设计一种抗旁路攻击的紧凑型SM4加解密电路具有重要的现实意义。论文的主要工

学位

便携式消防水炮控制系统的研究与设计

火灾具有燃烧猛烈、蔓延迅速的特点,对人民生命财产安全构成极大威胁。因此,如何有效灭火一直是人们关注的重点之一。消防水炮喷射量大且射程远,因而在室外空旷灭火场合使用较多,但传统的消防水炮需要人力控制,对人员的体能消耗提出挑战,同时其数十米的射程尚不足以在诸如油库和森林火灾的场景下保障消防作业人员的安全。本文总结分析了现有消防水炮系统设计和火灾探测技术,结合运用嵌入式系统和图像识别等多项技术,设计提出

学位

优化的近似Booth乘法器设计和评估及概率错误模型分析

随着互联网和移动应用技术的不断发展,计算机系统的能耗以惊人的速度持续增长,对数字集成电路的低功耗设计提出更高的要求。近似计算利用许多系统和应用程序能够容忍计算结果损失部分准确性的特性,通过对乘法器等基本运算单元进行近似操作,在满足系统性能指标的前提下,节省资源消耗并提高工作效率,目前已经被广泛重视。本文基于乘法器结构,设计出优化的近似乘法器和近似Booth-截断乘法器,并针对近似Booth乘法器构

学位

强PUF安全性分析及抗模型攻击策略

伴随着移动通信技术和微处理器的快速发展,终端设备安全日益成为热点问题。物理不可克隆函数(Physical Unclonable Functions,PUF)作为一项新兴硬件安全组件,利用电子元件制造工艺的限制,提取元件内部随机且细微的差异并将其产生的二进制序列作为响应。PUF因具备不可克隆、资源开销低等特性,在密钥安全及身份识别等领域中拥有良好的发展前景。本文先详细介绍PUF的基本原理、结构分类和

学位

两级式变换器一体化控制

学位

集成微波光子多普勒频移测量与雷达成像研究

多普勒效应在雷达系统中有着重要应用。一方面通过测量多普勒频移可以推算出被探测目标的速度,另一方面也可以通过距离-多普勒原理进行逆孔径合成成像,获取更多的目标信息。现代化战争中电子对抗日益激烈,传统的窄带雷达难以满足全方位的作战需求。微波光子技术作为微波技术和光子技术的融合,具有高频率、大带宽、抗电磁干扰等优点,可以显著提升雷达的性能。但目前的微波光子系统大多由分立器件构成,存在重量大、体积大、成本

学位

星载光子计数激光点云信号处理及在植被遥感中的应用

学位

数字图像水印算法设计与优化

互联网使用的爆炸式增长使得信息传播变得越来越容易,导致了严重的版权侵权问题,例如未经授权的复制、分发和修改数字化作品。为了提高网络信息的有效利用率,版权保护变得尤为重要。作为一种广泛使用的保护技术,水印方法已应用于多媒体版权保护的许多领域。水印是一种常用的信息嵌入技术,用于保护图像,视频和音频信息。它通过不可见的修改将关键信息嵌入到需要保护的数据中。在图像水印方案中,主要的关注点有安全性、隐蔽性和

学位

图像水印

基于特征研究与多输出BLSTM的语音情感识别技术研究

其他学术论文