基于非线性特征和谱图特征提取的语音情感识别技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:tireda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人类日常生活中最重要的交流方式之一,蕴含着丰富的情感信息。为了使人与机器的交互能够更加自然与智能,越来越多的学者开始关注与研究语音情感识别的相关内容。虽然在近几十年中,对语音情感识别的研究取得了很大的进步,但是在现有的语音情感识别系统中,仍然缺少能够准确识别语音情感信息的情感特征。因此,对语音情感特征提取技术的研究,仍是目前研究的重点,提取更加具有代表性的语音情感特征,提升语音情感系统的识别准确性对于人机情感交互有很高的现实意义。对此,本论文主要进行了如下的研究工作:(1)提出了一种基于决策层幂指数加权的多特征融合方法。目前研究学者大多采用特征级联的方法进行情感特征融合,忽略了特征间信息的差异性;也有少数学者采用基于简单加法或乘法规则的决策级融合方法,该方法在分类器识别效果相差不大时,无法很好的发挥决策融合的效果。针对上述情况,本文提出了一种基于幂指数加权的决策级融合方法,引入幂指函数计算权重系数,从而对权值进行重新分配,使得性能较好的分类器得到较大的权重,从而提升最终的识别效果。在CASIA中文语料库上的实验表明,该方法相比于常用的特征级联方法,识别效果较好。(2)传统的情感特征提取方法均假定语音是短时平稳信号,而实际语音信号是非线性非平稳的。针对上述情况,本文选择集合经验模态分解(EEMD)算法对非线性非平稳信号进行处理,在EEMD算法的基础上提取了一种本征模态函数(IMF)能量熵特征,记为IMFE特征。语音情感信号经EEMD分解得到一组本征模态函数(IMF),通过Spearman Rank相关系数筛选出与语音情感信号相关度较高的IMF分量,并计算IMF分量的能量熵(IMFE)作为新的语音情感特征。在CASIA中文语料库上进行识别,并与传统的声学特征、MFCC特征进行对比,结果表明所提的IMFE特征可以有效识别情感,且对负面情感的识别效果更优。(3)针对目前相对较少的基于时频结合的谱图特征领域,提出了一种基于Gabor灰度图像谱的改进完全局部二值模式(GGCLBP)特征提取方法。提取语音情感信号的语谱灰度图,采用Gabor变换放大语谱灰度图的局部纹理信息,得到Gabor灰度图像谱,再采用改进完全局部二值模式的方法提取Gabor灰度图像谱的纹理特征信息,构成GGCLBP特征。在CASIA中文语料库上进行识别,结果表明相比传统声学特征,GGCLBP具有较高的识别效果,并且具有较好的融合性。
其他文献
电主轴系统由于加工精度高、质量好等优势得到广泛应用,目前已成为高档数控加工中心的核心部件。高档数控加工中心加工精度的高低直接取决于电主轴系统的动力学及热力学特性,电主轴系统中各接触面的微观形貌又直接决定了电主轴系统的热态特性。因此,应用分形理论对圆弧形接触面间的接触热导(TCC)及其对电主轴系统热特性影响进行分析研究具有重要意义。本文以某公司ES系列电主轴系统作为研究对象,建立圆弧形接触面间结合部
连铸坯热送热装技术具有降低能源消耗,简化工艺流程,提高金属收得率等特点,为钢铁企业带来诸多经济效益。但含Nb等微合金钢连铸坯采用热送热装技术时,常常会造成轧材表面裂纹率大大增加。铸坯表面淬火技术能够改变铸坯表层组织的热履历,有效解决含Nb等微合金钢连铸坯热送裂纹问题。但是连铸坯表面淬火技术的一些具体工艺参数,如淬火开始温度、淬火速度等,以及淬火过程中铸坯温度变化情况,仍需要进一步的研究。本文以国内
近年来,核电设备、涡轮叶片等关键部件的安全可靠性引起学者的极大关注。相比于标准力学性能实验,小微试样实验技术可以有效地避免对在役构件造成严重破坏,在材料性能研究中得到了越来越多的重视。悬臂梁弯曲疲劳实验与小冲杆蠕变实验因其试样尺寸微小而适用于对在役设备以及关键结构部件的疲劳性能和高温蠕变性能预测,而且结果与常规疲劳和蠕变实验近似,已逐步被应用于核电、航空航天等领域。本论文工作选择316不锈钢和In
液晶弹性体材料是基于传统的弹性体和高分子材料进行分子设计、引入液晶相态并构造热力学稳态的新一代高分子材料。液晶弹性体材料兼具液晶的各向异性和高分子网络的橡胶弹性,与非交联液晶高分子相比,液晶弹性体具有独特的软弹性。而手性液晶弹性体因其具有螺旋结构赋予了其更多优异的性能。手性液晶弹性体不仅具有一般弹性体优良的机械性能、热和化学稳定性,还具有因手性带来的铁电性、压电性等,使其在显示、压电、非线性光学、
碳纤维增强碳化硅陶瓷基复合材料(Cf/SiC)具有高硬度、耐磨性、低密度、高强度等卓越性能。作为一种新型的高温材料,Cf/SiC材料已经被广泛应用于航空航天、交通等领域。但是Cf/SiC材料加工技术研究目前仍处于初级阶段,Cf/SiC材料加工质量难以保证,严重阻碍了其使用和发展。Cf/SiC材料具有各向异性的特点,基体和纤维具有不同的强度和刚度,存在强度较弱的界面层,在受力时易出现界面脱粘。传统的
数控机床进给系统的性能一方面取决于各个零部件的制造精度,另一方面也依赖各个部件间的装配精度。导轨作为构成进给系统的关键零部件之一,其制造安装精度是确保进给系统中各主要零部件间相对装配精度以及运动精度的基础,会最直接的影响到工作台的运动姿态,进而成为影响工件的形状误差和位置误差的主要因素之一。导轨副作为影响工作台最直接的因素之一,当前缺乏完整而系统的方法评估导轨误差对工作台运动误差的影响作用,因此,
当下,随着工业生产水平的不断提升,模具作为最基础的工业生产装备,其自身高性能要求或恶劣的工作环境,使得模具的表面改性及失效修复具有越来越高的实际应用价值。激光熔化沉积技术是近年来迅速发展起来的一种可用于模具的表面改性与失效修复的新型增材制造技术,并且在其沉积质量影响因素(激光功率、扫描速度等)方面已经进行了很多的研究,但是待沉积基体自身因素对沉积层质量的影响规律很少有人去关注。而基体表面形貌会影响
钾储量丰富,氧化还原电势低(K/K+,-2.93 V),而且在电解液中K+具有相对较低的路易斯酸度,这些优点使得钾离子电池在成本、寿命、功率和能量密度等方面展现出突出优势,使其成为大规模储能电源的理想选择之一。然而,K+半径和质量较大,在电极材料中扩散速率缓慢,这给储钾电极材料的开发利用带来巨大的挑战。碳材料价格低廉且环境友好,可与钾形成KC8化合物;金属锑能够与钾发生多电子合金化反应形成K3Sb
人工表面等离子体激元(Spoof Surface Plasmon Polaritons,spoof SPPs)是光频段表面等离子体激元(Surface Plasmon Polaritons,SPPs)在微波与太赫兹波频段的拓展,SpoofSPPs结构具有色散特性以及约束电磁场能力易受结构参数调整的优点,被广泛应用于微波频段无源器件。本文对结构尺寸小、易于加工、集成的二维平面spoof SPPs结构
转子结构作为机械产品当中最为常见的一种结构,广泛存在于各种动力机械以及化工机械当中。随着转子系统的不断运行,转子系统出现故障的概率也进一步增大,如何对转子故障进行诊断就成为了一项非常重要的研究内容。故障的发生常常表现为系统非线性的进一步增强。因此,通过对转子系统的非线性特征进行实时定量的检测,我们就大概可以知道故障的严重程度以及发生位置,从而为下一步的检修做好充分准备。因此,对转子系统的非线性特征