【摘 要】
:
针对现有语音情绪识别方法特征提取完整性和准确率较差的问题,将注意力机制和长短时记忆网络(Long short-term memory,LSTM)相结合,提出了一种语音情绪识别模型.该模型首先采
【机 构】
:
浙江理工大学信息学院,杭州310018
论文部分内容阅读
针对现有语音情绪识别方法特征提取完整性和准确率较差的问题,将注意力机制和长短时记忆网络(Long short-term memory,LSTM)相结合,提出了一种语音情绪识别模型.该模型首先采用语音信号的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为LSTM的输入,借助LSTM对频谱序列进行建模,并在LSTM的遗忘门和输入门中做窥孔连接,将单元状态也作为输入数据加入门限层中;然后将LSTM得到的情感特征输入注意力层,计算每一帧语音信号的权重;最后使用权重较高的语音特征来区分不同情绪,完成对语音信号的情绪识别.结果 表明:该模型与基础LSTM模型相比,在EMO-DB、CASIA和RAVDESS三种数据集上准确率分别提高2.96%、2.66%和7.06%,召回率和F1值也均有提高.这表明提出的模型语音分类识别性能较强,有效提升了语音情绪识别的准确率.
其他文献
陈旧性肛裂是肛管感染性溃疡,由局部炎症长期刺激并形成增生性纤维组织。此组织挛缩与深层组织粘连,导致肛门紧缩状态形成,此紧缩状态感越明显,排便越困难,并诱发内括约肌痉挛。通
对于r∈(0,1),通过揭示由第一类完全(p,q)-椭圆积分定义的(p,q)-Gr(o)tzsch环函数(μ)p,q(r)和(p,q)-Hübner函数Mp,q(r)以及初等函数定义的一些组合的单调性、凹凸性,给出了
孩子一病,做父母的岂能不着急?而情急之下,难免病急乱投医。常人以为,有病进大医院,总没错吧!?其实,非也。
Children sick, how can parents do not worry? And in desperat
肛裂多发生于肛管后正中位,其次是前正中位。女性前后位均发生者多见。现代研究认为,肛裂的本质是一种缺血性溃疡病,其发病机制主要是内括约肌痉挛,张力升高导致肛管静息压升高,诱
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
中国水资源短缺且分布不均,水资源利用的矛盾已从供给不足转为承载过度.以“可持续利用”概念为框架,在生态完整、水资源持续有效供给的基础上结合虚拟水社会循环过程,完善水
采用痔上黏膜缝扎+多发混合痔分段外剥内扎术治疗多发混合痔,以肛垫学说为基础,对传统外剥内扎术的改良术式,有效降低了术后出血、创缘水肿发生概率,避免黏膜外翻、肛门狭窄、感
为探讨混合痔的有效治疗方法,对采用综合治疗的74例混合痔进行回顾性分析.74例均一次性治愈,疗程18-30d,平均20d,无肛门失禁和狭窄.结果表明,混合痔以内痔为主而分界清楚
钙钛矿太阳能电池(Perovskite solar cell,PSC)中的界面是栽流子分离与传输的重要通道,高质量的界面有利于栽流子的抽取并减少复合,是制备高效率太阳能电池器件的关键.在含有
城市绿色空间是城市生态系统的重要组成部分,与其他类型的城市相比,工业城市生态环境问题相对突显,应更加重视防护型绿色空间网络化布局与建设.2000-2017年间,工业城市包头市