论文部分内容阅读
语音情感识别是现代社会实用性很高的一项情感计算技术,由于情感语音特征的提取方式、效果以及识别网络的选用对情感识别效果的影响很大,本论文对采用过程神经网络作为识别网络来对语音情感进行识别。本论文主要分析了决定语音情感识别的三个因素:特征提取、特征处理和识别网络。第一,分析了能够准确表达情感语音的情感状态的特征值;第二,分析了提取到的特征值进行特征分析以及降维处理之后,为后续识别网络的识别计算提供便捷;第三,针对情感语音提取到的基音频率、振幅特征以及共振峰参数,对特征值进行降维处理之后作为情感识别的输入,分析了过程神经网络用于语音情感分类的原理。本论文主要是采用自相关函数法求取语音信号的基音频率特征,使用瞬时平均幅度法求情感语音的振幅特征,采用线性预测法LPC求共振峰轨迹,对基音频率的8个特征值、振幅特征的8个特征值、共振峰的3个特征值、改进算法的MFCC特征的4个特征值总共23个特征值进行主成分分析降维处理,得到9维的特征值作为识别网络的输入。最后将降维处理后的特征值作为识别输入,采用过程神经网络对情感语音信号进行语音情感识别。识别率已经可以达到84%。