基于AdaBoost和ELM的语音情感识别研究

来源 :天津师范大学 | 被引量 : 2次 | 上传用户:weiwen2100000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感是人类的本能,因为情感我们得以在工作和生活中更好地做出行为决策。同时,为了更好地实现人机交互,国内外研究学者把情感融入其中进行识别。现如今情感识别的类别主要有:人脸情感识别、语音情感识别、生理模式情感识别等,这些情感识别处理技术促进人机相互协作从而做出正确的行为决策以应用于工作生活中的各个领域。由于语音信号包含说话人多种混合信息,较具代表性,近年来,语音情感识别越来越受到人们的广泛关注,它是实现人机交互、在线交流等的重要途径。现如今深度学习已贯穿人工智能的各个领域,在语音情感识别上正发挥着如火如荼的作用,而机器学习算法的单分类器在分类效果上则表现出了劣势。然而实验时我们还需要具体问题具体分析,在处理小样本特征数据时,单隐层的神经网络模型较深度学习在分类测试的时间上有较好地体现。同时为了解决单一的弱分类器在语音情感识别中数据过拟合导致分类正确率偏低的问题,本文提出了基于AdaBoost和ELM(超限学习机)结合的提升分类模型。实验中分别提取三种不同的语音情感特征,然后分别将这些样本特征数据进行归一化、降维后放入到本文涉及到的情感分类模型中。与相关工作进行对比来说明SVM(支持向量机)和ELM的分类性能,然后又对这两个单分类器分类识别的运行时间进行了比对;继而通过设置用户依赖模型和用户混合模型来对ELM、本文提出的AdaBoost和ELM相结合的语音情感分类模型分别进行实验对分类性能进行对比分析。实验结果表明,本文提出的分类模型取得了较好的实验效果。在CASIA汉语情感语料库上,ELM的分类性能不论是在分类正确率还是分类时间上都要要优于SVM,并且本文提出AdaBoost和ELM相结合的分类模型的实验效果较用单一的ELM分类效果有明显提高,正确率提高6~7%;继而在2017年多模态情感识别竞赛数据库(MEC 2017)和IEMOCAP语料库上分别进行验证实验,在多个数据库上验证本文所提出算法的有效性和鲁棒性。实验结果显示在MEC 2017上的分类正确率比baseline高出了 7.48%;在IEMOCAP上的分类结果为67.50%,比先前工作者提出的RNN-ELM模型的分类正确率提高了 3.61%。
其他文献
冶金矿山设计的剖析长沙冶金设计研究院近10年来,我院承担的冶金矿山设计项目共38项,设计的总规模为1866万t/a,其中铁矿石1335万t,锰矿石130万t,铬铁矿9万t/a,辅助原料392万t/a。建设这些矿山,取得了很多经验,也有不
为配合国家开展的“全民健身运动”、“阳光工程”、“有效教学”和国家新颁布的《中等职业学校体育与健康教学指导纲要》指示精神,我市在市体育教研会的领导下在全市中职学校
<正>6月9~11日,由万新光学集团冠名,重庆精益高登眼镜连锁有限公司、重庆千叶眼镜连锁有限公司、中国眼镜科技杂志社共同主办,天津市眼镜行业协会、天津市眼科医院验光配镜中
宝钢一直重视余热(能)回收利用工作,近几年宝钢在低温余热回收方面也取得了重要的进步,本文分析了宝钢股份总部低温余热资源及低温余热利用现状,重点介绍了宝钢在加热炉、退
《罗密欧与朱丽叶》是莎士比亚的经典戏剧之一。人们认为,蒙太古与开普莱特两家的仇恨是悲剧的根源,茂丘西奥之死是矛盾激化的导火索,罗密欧与朱丽叶的殉情是促成家族和解的
目前我国对VIE结构境外上市模式的规制主要是体现在外资准入、外资并购、外汇流动、境外投融资管理方面的法律规章中。近年来,尤其是2014年以来我国政府陆续修订出台了多项影
当前,互联网日益成为驱动创新发展、推动社会进步、惠及人类社会的中坚力量,全球互联网保持快速增长,我国互联网发展稳中有进,行业发展呈现新态势、孕育新趋势。本文基于对互
教学设计的内涵随着社会的发展得到不断的深化,对此不但可以从狭义和广义两方面来理解,还可以从绩效技术的发展、教学设计的科学性和艺术性等角度来认识。通过对教学设计的应
爱是火石,是光源,能点燃学生心灵的火花,能照亮学生的前程;爱是永恒的付出,是生命中最美丽的情感。我一直相信,只有爱才有真正的教育。爱之所及,行之所至。能够付出爱心的老师,一定会
积极心理学是指利用心理学目前已比较完善和有效的实验方法与测量手段,来研究人类的力量和美德等积极方面的一个心理学思潮.积极心理学的研究对象是平均水平的普通人,它主张