相空间重构在语音情感识别中的研究

来源 :长沙理工大学 | 被引量 : 3次 | 上传用户:halfmile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术的迅速发展,情感信息作为认知过程中的重要组成部分已经得到了研究学者普遍的认同和重视,而语音情感识别又是情感计算的重要组成部分,针对当前语音情感特征的不全面性和识别率不高的现状,本文做了如下研究:(1)根据语音信号本身的特征信息,从传统的声学角度出发,提取了传统的韵律情感特征(短时能量、过零率、基频)和频谱特征(MFCC),然后对提取后的特征数据进行相关统计特征的计算,其中统计特征包括了最大值、最小值、中值、方差等,并将此数据作为情感特征参数的原始特征数据集合。(2)基于语音信号发声机理的复杂性,从混沌信号的角度对语音信号进行分析,首先通过对语音信号lyapunov指数的提取,判定信号是否具有混沌性,再将语音信号进行相空间重构,通过对高维的语音信号进行分析并提取能表征语音混沌特性的情感特征参数(关联维和Kolmogorov熵),实验结果显示新特征的引入能更为全面地表征语音信号中情感状态的信息,将语音语义的信息弱化。(3)本文采用支持向量机(Support Vector Machine,简称SVM)对语音情感进行识别实验,通过传统特征,混沌特征以及融合后新的特征数据进行三组对比实验,结果表明,混沌特征的引入对识别效果有了一定的提高,但对于悲伤和平静两种情感容易混淆,基于此,对SVM识别算法中的惩罚因子和核函数参数g进行网格搜索算法的改进寻优,通过两次寻优的过程,将悲伤和平静两种状态的样本进行单独的识别实验,结果显示,二次寻优后的识别算法对于提高准确率有了很大的提高。
其他文献
学位
本文研究了井下人员检测跟踪系统的功能组成,给出了系统的理论模型,并对各组成部分进行了详细的论述。井下人员检测跟踪系统主要由监控中心计算机系统、检测基站和短距离无线通
正交频分多址(OFDMA)的数据传送速度非常快、频谱使用效率大以及抗多径干扰能力十分强,使其成为无线通信系统的空中接口标准和第四代移动通信系统(4G)TD-LTE的重要支撑。因为
ITU-T推出的G.984.x系列标准对规范GPON的实现产生了重要影响,但是标准仅对GPON的基本结构和协议进行了详细的规定。如果需要将GPON投入实际的商业运营,GPON还有很多关键技术