相空间重构在语音情感识别中的研究

来源 :长沙理工大学 | 被引量 : 3次 | 上传用户：halfmile

【摘要】

：

随着人机交互技术的迅速发展,情感信息作为认知过程中的重要组成部分已经得到了研究学者普遍的认同和重视,而语音情感识别又是情感计算的重要组成部分,针对当前语音情感特征

【作者】

：

陈鑫

【机构】

：

长沙理工大学

【出处】

：

长沙理工大学

【发表日期】

：

2014年01期

【关键词】

：

关联维 Kolmogorov熵特征提取网格搜索情感识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人机交互技术的迅速发展,情感信息作为认知过程中的重要组成部分已经得到了研究学者普遍的认同和重视,而语音情感识别又是情感计算的重要组成部分,针对当前语音情感特征的不全面性和识别率不高的现状,本文做了如下研究：(1)根据语音信号本身的特征信息,从传统的声学角度出发,提取了传统的韵律情感特征(短时能量、过零率、基频)和频谱特征(MFCC),然后对提取后的特征数据进行相关统计特征的计算,其中统计特征包括了最大值、最小值、中值、方差等,并将此数据作为情感特征参数的原始特征数据集合。(2)基于语音信号发声机理的复杂性,从混沌信号的角度对语音信号进行分析,首先通过对语音信号lyapunov指数的提取,判定信号是否具有混沌性,再将语音信号进行相空间重构,通过对高维的语音信号进行分析并提取能表征语音混沌特性的情感特征参数(关联维和Kolmogorov熵),实验结果显示新特征的引入能更为全面地表征语音信号中情感状态的信息,将语音语义的信息弱化。(3)本文采用支持向量机(Support Vector Machine,简称SVM)对语音情感进行识别实验,通过传统特征,混沌特征以及融合后新的特征数据进行三组对比实验,结果表明,混沌特征的引入对识别效果有了一定的提高,但对于悲伤和平静两种情感容易混淆,基于此,对SVM识别算法中的惩罚因子和核函数参数g进行网格搜索算法的改进寻优,通过两次寻优的过程,将悲伤和平静两种状态的样本进行单独的识别实验,结果显示,二次寻优后的识别算法对于提高准确率有了很大的提高。

其他文献

2006-2011年名山县居民户碘盐检测情况

期刊

社区卫生服务中心对高血压病人的病因分析及干预指导

期刊

车载协作通信系统中继选择策略与差错性能分析

学位

血栓抽吸双并替罗非班对急诊介入治疗疗效观察

期刊

人工流产并发症的分析

期刊

纳络酮治疗肺性脑病的临床探讨