融入生理学和行为学特征的言语情感识别研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:wcf333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
即将到来的万物互联时代为人机交互领域提供了巨大的发展机遇,言语交互是人机交互中最自然,最便捷的交互方式。言语情感识别是言语交互中非常重要的一环,只有准确地识别说话人的言语情感信息,才能理解说话人的言外之意,实现有效言语交互。互联网环境中,言语情感信息可以在文本(如微博等)和语音两个言语通道上进行传递。文本情感通常是指说话人有意识的情感表达。从情感言语生成角度看,说话人的心理和生理状态都会反映在言语内容和行为信息等特征上,从这些特征信息中可以挖掘用户的情感状态。比如,微博用户的心理和生理状态会导致其言语内容和交互行为特征上的不同,通过这些特征信息可以挖掘用户是否有抑郁倾向情绪。语音情感更多的是一种无意识的、不由自主的情感表达。从情感言语感知的角度来看,声音进入听话人的听觉生理系统进行一系列的转换到达听觉皮层,通过语音音调、强度和持续时间等特征识别用户情感状态。
  本文根据文本产生和语音感知的特点,从不同的角度将生理学和行为学特征融入到言语情感识别研究中。在文本情感识别中,我们主要通过微博的文本内容和交互行为学特征挖掘微博用户的生理和心理状态,在语音情感识别中则主要利用听话人的听觉机理抽取语音中和情感相关的有效特征表示来提高情感的识别率。基于这个研究思路,本文在文本情感挖掘和语音情感识别中,在以下四个方面进行了创新性研究:
  (1)本文提出了一种结合用户行为特征的口语化文本情感识别方法,具体是指在文本言语通道上的抑郁倾向人群识别。首先根据口语化文本的新特点构建了抑郁情感词典并基于该词典提取文本特征表示,然后结合用户言语交互行为特征采用多核学习方法找到异构特征与情感的最优映射来实现抑郁倾向人群识别。实验结果表明,结合文本特征表示和交互行为特征是一种有效的情感挖掘方法。
  (2)本文首先提出了基于耳蜗滤波的情感识别方法,虽然该方法取得了比基于MFCC的方法更好的结果,但它存在明显的缺点,因此本文进一步提出了基于听觉调制的情感识别方法。基于听觉调制的方法引入了调制滤波来产生多维时间调制线索,然后采用3DCNN(convolutional neural network)模型直接对调制线索进行联合谱时特征学习。实验结果表明,3DCNN可以从时间调制线索中有效提取情感区分性的听觉表征。
  (3)受人耳听觉注意机制的启发,本文提出了一种基于注意力模型的滑动循环网络(Attention-based sliding recurrent neural network,ASRNN)模型来识别语音情感。其中,通过滑动窗来实现持续关注并提取连续的段级内部表征,然后通过时域注意力模型来实现选择性注意机制。最后通过注意力听辨实验对注意力模型和人耳听觉注意机制的相关性进行了比较分析。实验结果表明,该模型能从听觉表征中有效地捕获显著的情绪区域。
  (4)受人耳听觉系统多尺度调制的启发,本文提出了基于多分辨率调制耳蜗图(multi-resolution modulation-filtered cochleagram,MMCG)特征的维度情感识别方法。其中MMCG把时间调制线索编码成不同分辨率的调制耳蜗图来捕获时间和上下文调制线索。考虑到MMCG中的每种调制耳蜗图包含不同尺度的调制线索,本文设计了一种并行LSTM网络结构从不同分辨率特征中建立多个时间依赖关系并跟踪情感在时间序列上的动态性。实验结果表明,MMCG特征能够获得多尺度情感信息,而并行LSTM能够有效地跟踪情感的时间动态。
其他文献
智能手机和平板电脑等移动终端设备的普及和实时系统的出现,使得核心网络面临着严峻的挑战。数量众多的终端设备进行数据传输消耗了大量的网络带宽和能量,目前骨干网没有足够能力来处理如此庞大的数据。作为5G的关键技术,移动边缘计算将计算、通信和存储等功能从网络核心迁移到网络边缘或者靠近用户的地方,具有高带宽、低时延和位置感知等功能,可以有效缓解骨干网的流量压力。  移动边缘计算与云计算优势互补。前者强调局部
三支决策是一种符合人类认知过程的“三分而治”决策模型,为处理不确定性决策问题提供了合理的解决方法。它同时考虑了决策过程中的不确定性和代价损失,符合人类思维决策的认知过程和选择习惯,是一个值得深入研究的热点。当不确定性决策中涉及多个相互冲突的属性信息时,支持直觉模糊集利用隶属度、非隶属度和支持度直观科学的对事物的不确定性进行刻画。从物体本身所固有的属性和外在对其影响考虑,对不确定性问题进行研究,提高
在现实世界中,优化问题无处不在,因此解决优化问题的方法在许多应用领域和科学研究中都占有重要的地位,且一直是研究的热点。但是随着社会的发展,需要解决的优化问题越来越多、越来越复杂,传统基于精确的数学方法不能很好的解决这些问题,故智能优化算法应时而生。生物地理学优化算法(Biogeography-Based Optimization Algorithm, BBO)是一种模拟物种生存的智能优化算法,它具
数字图像的内容丰富多彩,在商业、政治、军事等诸多领域得到广泛应用。云计算和互联网的迅速发展使大量的图像在网络中存储和传输,然而这些图像往往包含私人信息、企业的重要数据和军事机密信息等,因此防止图像信息泄露成为一个迫在眉睫的问题,图像隐写成为信息隐藏领域的研究热点。目前,深度神经网络在诸多领域取得良好的成果,正逐步向图像隐写领域渗透,并表现出其潜在的应用价值。本文主要从载体修改和无载体信息隐藏两方面
学位
图像是多媒体工具当中最重要的一种信息表达形式,被广泛应用到商业管理、教育教学、军事训练以及家庭生活等人类活动的诸多领域。互联网与多媒体技术的发展使得大量的图像数据在网络上存储和传输,而这些图像数据中很大一部分涉及到了个人隐私或者商业机密等秘密信息,因此,图像数据传输与存储的安全性问题亟需解决。图像隐写术是将涉密图像隐藏到非涉密载体当中,从而隐藏涉密图像的存在,达到信息安全隐蔽传输一种技术。传统的图
滚动轴承作为机械设备的关键支撑部件,由于长期在复杂工况下运行,极易产生各种故障,导致机械设备工作状况恶化。随着传感技术的迅速发展,对机械设备运行过程中顺序、大量、快速且持续到达的流数据进行不停机故障检测变得尤为重要,具有明确的学术价值和应用需求。然而,对于滚动轴承在线异常检测问题,目前仍存在以下问题:1)检测模型无法适应在线数据的轻微波动,使得检测模型将正常样本误判为异常,从而引起较高的误报警率;
学位
在公共卫生方面,传染病对人类生产生活的影响是全方位的,不仅会造成患者身体的不适或功能障碍,还会由于重大传染病的流行而引起人民的恐慌情绪和社会动荡,甚至能够阻滞国家的经济发展。媒介传染病是一类由动物传播的急性传染病,其中蚊媒传染病的占比较高。近年来随着全球气候变化、生态变化、人口流动和城市化等多种自然和社会因素的影响,直接或间接驱动了蚊媒传染病影响范围的扩大和爆发强度的增强。有效及时的预测传染病的暴
学位
按需服务是云计算模式的特色,能够大大降低云平台用户的计算成本。弹性资源管理是云平台实现按需服务的重要手段,而基于负载预测的自动伸缩技术是实现弹性资源管理的重要技术,负载预测的准确性成为影响弹性资源管理性能的关键。随着云平台规模的迅速扩大,计算资源的需求量、种类快速增长,如何对大量的、复杂多样的负载数据建立有效的预测模型,成为大规模云平台负载预测亟待解决的问题。为此,本文从利用任务负载序列间结构化信
学位
计算机网络和多媒体信息处理技术的飞速发展给我们的日常生活带来了很大的便利和效率,同时越来越多的数字信息被存放于公开的网络环境当中,面临着前所未有的被非法获取或者恶意篡改的风险。因此,数字信息的隐私保护以及安全管理问题变得尤为突出。密码学是实现数据隐私保护的主要技术手段,信息隐藏则是保护宿主以及隐秘信息安全传输的主流方式,将二者相结合则可以在保护数据隐私性的前提下通过嵌入信息实现对宿主有效的安全管理
学位
多Agent协作追捕问题研究的是由多个Agent组成能相互协作的团队,去追捕另外一个或一群移动的Agent。多Agent协作问题是多Agent系统的研究热点,而多Agent协作追捕问题是多Agent协作研究中的一个典型问题,这些典型问题的研究成果中所涉及的关键技术已被广泛应用于军事,工业等,如战场搜救,捕俘动作,代理合作,军队包围并抓获入侵者,空战等领域。  多Agent协作追捕问题中,逃跑者与追