图像与文本融合的多模态在线学习情感分类研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:slchen168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线学习作为“互联网+教育”的产物,具有不受学习地点限制等优势,已经成为主流的学习方式之一。由于在在线学习环境中,教师与学生之间在空间上处于分离状态,使得教师无法准确地了解学生在学习过程中产生的情感。虽然基于深度学习的情感计算为自动分析人们的情感状态提供了技术支持,但是目前对于学生情感状态的识别大多基于单个模态实现,容易出现识别不稳定等问题。基于此背景,本文采用面部表情识别和文本情感分析技术,将图像和文本两个模态进行融合实现学习情感状态的识别,帮助教师与学生之间进行及时的情感沟通以提高学生的学习效率。本文的研究内容主要包括以下三方面:(1)提出了一种基于金字塔卷积及全局注意力网络的表情识别模型,解决了面部表情的多尺度特征提取问题,并根据贡献程度为设定的输入关键帧进行排序。首先将视频片段的多张图像帧作为模型的输入,通过金字塔卷积模块进行多尺度特征提取,再将提取到的特征图输入到全局注意力模块,给每一张图像帧对应的特征图分配权重,促使模型关注含有重要信息的特征图,然后将特征图进行加权求和,可以得到新的含有注意力信息的全局特征表示,最终通过分类器进行表情的识别,在实验中得到了82.12%的准确率,优于其他方法。(2)提出了融合拼音特征的BERT-BiGRU文本情感分析模型,解决了文本情感分析过程中文本特征向量空间稀疏问题,优化了特征提取与表示方法。首先将文本数据按字划分输送到BERT进行初步的特征提取,同时将相应文本的拼音输入到Word2vec进行词向量训练,然后与BERT的输出向量进行拼接得到了融合拼音的特征向量,将该向量送入BiGRU学习更多的上下文信息。该方法能够缓解文本底层特征和深度特征间的语义鸿沟,将文本情感分类的准确率提升至87.46%。(3)提出了自适应加权决策多模态融合的方法,解决了图像和文本两种模态有效融合问题。在分别得到图像和文本两种模态的情感极性分类结果后,通过香农熵计算两种模态分类结果的可信程度,自适应引入不同的决策权重,将两种模态的分类结果进行加权求和,得到最终的分类结果,建立基于图像和文本两个模态融合的情感识别模型。利用两种模态取长补短,得到的情感分类准确率为90.48%,优于多种决策融合规则,并与单模态分类结果相比有较大提升。
其他文献
随着各种网络社交平台的飞速发展和不断进步,互联网中文本信息的种类和数量也呈爆炸性增长,这为人们对有效信息的利用带来了巨大挑战。自动文本摘要技术作为自然语言处理的一项重要任务已经得到了广泛研究,在这当中,生成式文本摘要技术逐渐成为主流技术。然而,现有的文本摘要研究大都集中在新闻报道类的文档,对话作为人们生活中最常见的一种交流方式,具有话题漂移、冗长、信息密度低等特点,人们对此类文本摘要生成任务的研究
学位
目的 探讨运动疗法对妊娠糖尿病血糖的作用。方法 选取2021年1—9月中国科学院大学深圳医院产科收治的70例妊娠糖尿病患者为研究对象,依据随机数表法分为对照组和观察组,各35例。对照组采取常规模式护理,观察组采取常规护理+运动疗法。对比两组血糖水平、不良妊娠结局、心理状况评分。结果 护理后,观察组空腹血糖和餐后2 h血糖水平均优于对照组,差异有统计学意义(P<0.05)。两组产后出血和新生儿窒息发
期刊
本文从社交媒体中采集并处理了2012–2018年海南所有4A及5A级景区的评论数据构建了海南旅游景区评价数据集。本数据集旨在用于对海南旅游景区的质量评估、景区的容量管理、景区传播效果评价、景区网络舆情监测预警、景区网络口碑管理、景区形象管理、景区个性化推荐等研究。同时,结合多源化数据,本数据集可为研究海南省旅游发展提供数据支持。
期刊
本杰明·布里顿(Benjamin Britten,1913-1976)是二十世纪杰出的英国作曲家、指挥家和钢琴家。他的作品数量和体裁繁多,包括歌剧、合唱、交响曲和室内乐等,其中歌剧作品就多达16部。《比利·巴德》创作于1951年,这部歌剧改编自美国作家赫尔曼·梅尔维尔(Herman Melville 1819~1891)的短篇小说《水手比利·巴德》,是布里顿创作的第五部歌剧,也是继《彼得·格莱姆斯
学位
云计算的快速发展为用户提供了强大而便捷的数据存储和共享服务。然而,对云中海量数据在机密性和隐私性等安全方面的要求却制约了云计算相关应用的发展,特别是对于金融和医疗领域敏感数据的泄露和滥用无疑会给用户带来巨大的经济损失。为了保护用户数据安全,数据需要被加密后存放在云端,但这又使云服务器检索密文数据变得困难。具有等值测试功能的加密技术可以满足用户检索密文数据的需求,该技术可以在密文不预先解密的前提下判
学位
日益增长的学术数据为众多学者提供了有利帮助,学者们在已有研究工作的基础上不断改进创新,推动了科学研究的进步。然而另一方面,在海量的文献中快速且准确的找到适合自己研究方向的科研文献对学者来说也是一件非常困难的事情。近年来借助学术数据进行文献个性化推荐研究逐渐引起学者们的关注,然而现有的文献个性化推荐工作主要基于文献内容的相似性,而忽略了学者本人的研究领域、研究机构等重要信息,导致推荐结果个性化不足且
学位
随着混合学习的推进,富媒体技术环境带来的学生认知负荷增加问题引发人们关注。为探究混合学习情境下认知负荷对学习投入的影响,本研究基于某中学293位学生的问卷调查结果及其在线学习行为投入数据,利用结构方程模型,探究在线学习行为在心理投入对学习满意度影响中的中介作用,并采用多群组分析法检验认知负荷在其中的调节作用。研究发现,混合学习情境下学生的实质性在线学习投入有限;心理投入与在线学习行为投入对学习满意
期刊
局部社区检测基于用户给定的查询节点集来探索局部图结构,可以有效地支持个性化社区发现,在现实生活场景中具有广泛应用。属性网络是局部社区检测的重要研究对象,这类网络通常由附着属性的节点相连形成。属性网络上的局部社区检测具有如下挑战:一是种子依赖问题,即以位于边界或社区重叠部分的节点进行查询不能得到令人满意的结果;二是仅将属性信息简单视为边权重(如:属性相似度等)而无法揭示复杂语义。本文研究了两种属性辅
学位
本文以建国初期(1949)年也是天津解放之年至1966年的天津戏曲团体为研究对象,力图通过相关文献的整理、归纳、分析、评价,来展现1949-1966年天津的京剧、河北梆子、评剧早期在天津的传入与发展以及三大剧种团体的建立,由于天津优越的地理位置,众多优秀的戏曲艺人在津表演,由此在津演出的外地戏曲团体也成为天津戏曲音乐发展的一个重要条件。本文由绪论、正文五章和结论组成:绪论部分重点介绍论文所属的研究
学位
唐剧《人影》创作于1998年,是由河北剧作家陈家和进行编剧、郭学文负责导演的原创优秀现代剧作品。2002年作为第三届中国评剧艺术节祝演剧目首次与观众见面,广受好评。是唐剧作品中较为杰出的代表作品之一。本文对唐剧《人影》的分析,与以往文章不同之处是对《人影》的一些重点唱段进行分析与研究,通过对重点唱腔、音乐、表演等方面的分析,进而总结这部戏的艺术特点及创作经验,研究创作手法和理念,思考唐剧多年的成败
学位