基于深度学习的语音情绪识别算法研究与应用

来源 :南京邮电大学 | 被引量 : 2次 | 上传用户:jingjong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人机交互系统正逐渐走进我们的生活。语音情绪识别技术作为人机交互系统中的关键技术之一,可以准确识别情绪并帮助机器更好地了解使用者的意图,提升人机交互的质量,受到了国内外研究人员的广泛关注。随着深度学习在图像识别、语音识别等领域的成功应用,学者们开始尝试将其使用在语音情绪识别上,提出了很多基于深度学习的语音情绪识别算法。本文对这些算法进行了深入的研究,发现这些算法存在特征提取方式过于简单,对人为设计的特征利用率低、模型复杂度高,识别特定情绪准确率低等问题。针对这些问题,本文从特征提取算法和模型结构两个角度对语音情绪识别算法进行了改进,改进之后的算法不仅提高了语音情绪识别的准确率,还有效降低了情绪识别系统的复杂度。本文的主要研究内容如下:对基于深度学习的语音情绪识别算法进行研究。重点研究了基于深度神经网络的变长语音情绪识别算法,介绍了算法的模型结构和其中的关键技术。在标准语音情绪识别数据集——交互式情绪二元运动捕捉数据集(Interactive Emotional Dyadic Motion Capture,IEMOCAP)上对算法进行了性能测试。将定长语音情绪识别算法与变长语音情绪识别算法的性能进行对比分析,证明了变长语音情绪识别算法的优越性。最后分析了变长语音情绪识别算法存在的问题。针对变长语音情绪识别算法存在的对人为设计的特征利用率低、特征提取方式过于简单等问题,本文从特征提取算法和模型结构两个方面提出改进,提出基于加权特征融合算法和双向长短期记忆网络的变长语音情绪识别算法。在IEMOCAP数据集上对改进后的算法进行了性能测试,实验结果表明,改进之后的算法比原算法的准确率提升了超过5%。针对变长语音情绪识别算法模型复杂度高和识别特定情绪准确率低的问题,本文使用轻量级卷积算法和多任务学习算法进行改进,提出了基于轻量深度神经网络多任务学习的变长语音情绪识别算法。在IEMOCAP数据集上对改进后的算法进行了性能测试,实验结果表明,改进之后的算法在提升了超过8%的识别准确率的同时降低了模型70%的复杂度。
其他文献
本文对文化产业管理专业的发展现状进行简单介绍,说明文化产业管理专业目前存在的问题,明确该专业的未来发展方向并进行专业发展路线探讨。
分析施工企业造价管理现状,提出工程造价控制的措施,并重点在做好预算工作、分包管理工作、材料管理工作及索赔方面提出了一些观点与看法。
随着医疗卫生单位人事制度的改革,越来越多的医院开始招聘合同护士。本文对在合同制护士的护理管理中,恰当的应用激励作用来最大限度的调动合同制护士的积极性,使其全身心地投入
建筑业是我国的支柱产业之一,其发展关系着国民经济的发展,安全生产至关重要,提高和改善施工安全状况已经势在必行。本文就目前建筑施工安全生产存在的问题进行分析,探讨建筑施工
精心策划注重质量努力开创林业科技工作新局面邯郸市林业局1997年在河北省林业厅的帮助指导下,我局以提高“两高一优”持续林业和建立林业“三大体系”的质量和速度为中心,强力实施
粉煤灰和煤矸石是常见的大宗固体废弃物,如果没对其进行处理,会造成空气和水资源的严重污染。在中国,每年产生数亿吨的粉煤灰和煤矸石,对清洁生产产生了严重的负面影响。粉煤灰内含有活性A1_2O_3和活性SiO_2,化学激发后可以制成地质聚合物胶凝材料进行使用,因此采用粉煤灰地聚物为胶凝材料,利用煤矸石作为骨料制备出一种新型膏体充填材料,可以大量利用固体废弃物,进行清洁生产并保护环境。采用粉煤灰地质聚合物
目前,导致建设工程施工合同无效的原因主要集中在以合法形式掩盖非法目的和违反法律、行政法规的强制性规定两方面。本文作者针对建设工程施工合同无效的类型进行深入探讨,分析
2008年起施行的《中华人民共和国企业所得税法》及其实施条例结束了我国内外资企业所得税“双轨”模式的历史,统一并调整了企业所得税适用税率、税前扣除、税收优惠政策及税收
探讨了70例小儿支原体肺炎的临床表现特点。
据农业部统计,截至2005年底,中国的农民专业合作社或类似的农民合作经济组织已有15万个,其中建立了规范的民主管理机构,并制定了合作社章程和各项管理制度的专业合作社和专业协会