【摘 要】
:
语言是人和人之间进行沟通的重要途径,因为语言不仅能够进行信息的传递,同时还具有情感的表达功能。相同的话语在不同的情感环境下,往往表达着不同的意义,世界各地的语言都是如此。因此,语音情感识别的研究作为语音识别领域的一个重要分支,具有非常大的研究价值。语音信号的处理是人工智能情感计算领域中非常基本、重要的模块之一。国内外的重要研究者针对语音情感识别任务,通常将语音信号转换成的语音特征直接处理或者是转换
论文部分内容阅读
语言是人和人之间进行沟通的重要途径,因为语言不仅能够进行信息的传递,同时还具有情感的表达功能。相同的话语在不同的情感环境下,往往表达着不同的意义,世界各地的语言都是如此。因此,语音情感识别的研究作为语音识别领域的一个重要分支,具有非常大的研究价值。语音信号的处理是人工智能情感计算领域中非常基本、重要的模块之一。国内外的重要研究者针对语音情感识别任务,通常将语音信号转换成的语音特征直接处理或者是转换成语音谱图的形式进行识别。且语音情感识别在生产应用中于具备重要意义,引申出了多种应用,例如:辅助言语障碍的残疾人的机器、感受客户情感的服务机器等。本文对双语语音情感识别展开了深入的研究,提出了基于自编码器+LSTM的双语音语音情感识别模型和双线性胶囊网络的双语音情感模型,并通过这两种模型进行了相应的实验,与目前主流的语音情感识别方法进行比较得出了结论和展望。本文研究的具体内容包括:(1)提出了基于自编码器+LSTM的双语语音情感识别模型。本模型将原始的语音数据传入自编码器提取深度抽象的语音情感特征,并将深度特征经过LSTM网络进行进一步的处理,在德语EMO-DB和中文CASIA的混合语料库中取得较好的识别结果。(2)提出了基于融合特征的双线性胶囊网络的双语语音情感识别模型。本文将近几年在图像识别领域较为流行的胶囊网络应用于SER的探究,并针对双语之间的差异性,提出了梅尔频谱图和帧统计量特征图融合的方法,同时对胶囊网络改进,使用双线性卷积核进一步提取融合图的纹理特征。该模型在德语EMO-DB和中文CASIA语料库识别率取得了进一步的提高,提供了一种全新的语音图像识别的思路。针对上述两种模型,进行了大量的对比试验。实验结果表明:自编码器提取出的深度特征和梅尔频谱图与帧统计量图特征都比原本的语音特征效果更加好,同时两种模型在双语语音情感识别上取得了优秀的的识别效果,识别率较传统模型有大幅的提高。
其他文献
区块链技术的出现为解决企业网络治理难题提供了新的契机和治理方案,二者的融合成为必然。但双方融合还存在诸如公众认知和思维、区块链平台建设及自身技术难题、国家政策、制度设计等诸多需要跨越的障碍。如果能够充分发挥相关因素的作用,减少其阻力,则会对区块链与企业网络的融合产生巨大推动力。因此对区块链与企业网络融合动力机制与实现路径的研究很有必要。作者首先阐释了本文相关理论基础,包括协同创新理论和企业网络理论
<正>随着脱贫攻坚任务的圆满完成,我国社会救助迈向高质量发展的新阶段。救助理念从被动生存型向积极发展型转变,在保障基本生活需求基础上,着力增强困难群众的社会参与机会,确保改革发展成果更多更公平地惠及困难群众。《“十四五”民政事业发展规划》明确指出,“要改革社会救助制度,扩大社会救助服务供给,积极发展服务类社会救助,拓展‘物质+服务’的救助方式”。
对于新就业大学生群体来说,解决自己的住房问题是他们进入社会中冲锋陷阵、努力奋斗、为美好生活打拼的第一步,但现实的情况却是他们被纳入了城市“夹心层”。这其中的原因,第一,与他们进入社会走向独立获得收入的时间短、财富积累有限不无关系,这限制了他们不足以承受城市中的高房价以及随其而来的住房消费压力;第二,徘徊在住房保障范围之外,不能够获得精准有效的政策辐射,导致新就业大学生的住房问题更加突出。青年人才的
随着移动互联网技术的迅速发展,大数据的力量在诸多方面影响着人们的生活,但更多的是带来个人信息的改变,APP用户规模持续扩大,APP种类层出不穷,以及频繁发生的个人信息泄露事件,都在威胁着公民的人身和财产安全。因此,如何规范APP个人信息的收集和使用,并从法律层面寻求个人信息收集、使用发展之间的平衡,已经成为APP个人信息保护的核心问题。本文采用发现问题——分析问题——解决问题的模式,在大量翻阅和比
数字金融是数字技术与传统金融业深度融合,通过数字技术重构传统金融业态的新型金融服务,其实质是以新一代信息技术为核心推进金融业数字化的过程,具有普惠、高效、便捷的特点,已形成参与人数广、市场份额大的发展趋势。与此同时,数字金融并未改变其金融业本质,数字技术的加持是金融业增加了新的风险要素,这是导致该领域纠纷频发的诱因。在数字金融消费活动中数字金融消费者由于专业素质低、抗风险能力差、信息泄露风险高,故
“三农”问题是关系我国国计民生的重要问题,而“三农”问题的关键是粮食安全,必须引起重点关注。家庭农场目前已经成为我国新型农业经营主体的主要代表形式,对保障我国的粮食安全至关重要。2022年中央一号文件提到支持家庭农场多种粮,种好粮。2013年中央一号文件首次提到大力发展家庭农场后,我国家庭农场的数量迅速增长,规模日益扩大,收入保持稳定。但我国家庭农场的发展还存在许多制约因素,最重要的是家庭农场的融
在大数据时代背景下,个人信息成为支撑社会经济运营的新资源。然而大数据时代个人信息泄露与滥用频繁发生,对消费者权益造成严重侵犯,不仅极大困扰了消费者的生活,也严重影响了网络经济的平稳运行。在这之中,消费者敏感个人信息作为消费者个人信息的一部分,涉及消费者的人格尊严、人身利益和财产安全等,当消费者敏感个人信息遭受侵犯时,造成的危害将不可弥补。而我国关于敏感个人信息保护的立法又刚刚起步、有关敏感个人信息
应对以CO2为主的温室气体减排成为人类目前面临最严峻的环境和现实问题之一。我国在2020年首次提出“碳达峰、碳中和”的目标,通过发展林业增加碳汇量是实现该目标的重要途径之一。基于此,研究森林生态系统碳储量具有十分重要的意义。本文利用山西省安泽县2010、2015和2020年3期森林资源二类调查数据,以森林乔木层主要树种为研究对象,运用生物量转换因子连续函数法,估算了乔木层总碳储量,并从林种、起源、