基于辅助信息抽取与融合的社交媒体图文情感分析方法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:shentong0312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的迅速发展,包含图片和文本的多模态数据开始广泛出现在各种社交平台上。这些数据为情感分析提供了全新视角,多模态情感的自动分析与理解开始受到学术界关注。但目前社交媒体图文情感分析研究大多关注单一图文对,忽略了社交帖子中可能涉及多幅图片的事实。此外,现有情感分析方法未能充分考虑文本和图像中的关键辅助信息。为解决上述问题,本文从文本和图文两方面展开情感分析研究工作。首先,针对现有中文图文情感数据资源相对缺乏的问题,本文结合实际需求构建了一个大规模中文社交媒体图文情感数据集,其中每个社交帖子中可以包含多幅图片,并将其用于评估不同情感分析方法在社交媒体图集文本数据上的性能。其次,借鉴序列标注(Sequence Tagging)的思想,本文采用两种不同方式抽取文本中显著表达用户情感倾向的文本情感辅助信息。一是使用多种方式对文本进行特征表示,然后采用双向长短期记忆网络(Bi-directional Long Short-Term Memory,Bi LSTM)预测文本中每个字属于不同标签的概率,最后使用条件随机场(Conditional Random Fields,CRF)筛选获得最终抽取结果;二是在文本表示阶段引入词性信息,获得更加丰富的语义信息,并将依存句法信息融入到图卷积网络(Graph Convolutional Networks,GCN)中以捕捉远距离字符间的依赖关系,尝试改善文本情感辅助信息抽取效果。最后,本文提出两种社交媒体图文情感分析方法。一是利用协同注意力机制捕捉图集和文本之间的关联信息,进行图文情感分析;二是在第一点基础上,针对社交媒体图集中存在的部分图片与图文整体情感不一致问题,将抽取的文本辅助信息融入图文情感分析任务中。同时在多任务学习框架下,利用图片情感辅助标签识别任务辅助图文情感分析,并解决可能存在的图片情感不一致问题。实验结果表明,融合辅助信息的图文情感分析方法能够有效提升情感分析性能,为图文情感分析任务提供新思路。
其他文献
研究主要目的是设计出海上风电机组关键部件并分析环境对机组的影响。随着对清洁和绿色能源的需求不断增加,正在从旧技术向可持续的新技术。现在的主要重点是可再生能源。由于海上风电机组在可再生能源中发挥着重要作用,成为关注重点。此外,根据设计的安全性,本设计符合国际标准和准则。然后,在结构分析中也与国际安全标准进行比较。
学位
现如今保证供电质量的稳定性和持续性十分重要,但是国家电力建设范围广,所处地形比较复杂,传统的人工巡检方式危险性高、效率较低,巡检机器人代替人工开展发输变配环节的电力巡检成为一个热门的研究领域。其中,同步定位与地图建图(Simultaneous Localization and Mapping,SLAM)技术是巡检机器人估计自身位姿的重要环节。窄视角非重复式扫描激光雷达在SLAM应用中受视场角大小的
学位
以黄磷炉渣为硅源制得SiO2基体材料,将MgO负载在SiO2基体材料表面制备了SiO2-MgO复合材料,用于吸附刚果红染料。考察了吸附时间、吸附温度、刚果红染料废水、初始质量浓度对吸附效果的影响。研究表明:当刚果红质量初始浓度为50mg/L、吸附剂用量为0.1g、吸附温度为25℃、吸附时间为10min时,吸附率可达99.73%,吸附量为49.87mg/g。SiO2-MgO复合材料吸附性能好,且实验
期刊
坚强智能电网对于电力系统运行稳定性和持续性要求进一步提高,这需要对输电线路进行短周期、高效率的巡检维护。目前,无人机拍摄高清图像已经逐步替代人工巡检,成为输电线路巡检的主要方式,随之带来的是海量巡检数据处理的准确性和实时性问题。当前,应用深度学习的识别算法对于绝缘子等大尺寸部件取得了较好的识别效果,但是对于销钉这类尺寸小、相似部件多的部件,识别精度一直难以满足实际应用的需要,是目前研究的重点与难点
学位
近年来,光伏、储能等新能源电源的装机占比逐年提升,直流负荷的需求也日益增加,直流配电网受到了广泛关注。电力电子变压器具有高功率密度、多电压端口、电气隔离、控制策略灵活等特性,成为了直流配电网的核心组成部分,用于友好消纳分布式光伏等新能源电源,向直流负荷供给电能。受环境和现有技术限制,光伏等新能源电源的输出功率存在随机性和间歇性,直流配电网需配置一定容量的储能设备保证电能质量。当直流线路发生故障时,
学位
在全面推进碳达峰和碳中和进程,加快产业结构和能源结构转型升级,加强化石能源的清洁高效利用,综合解决包括资源-能源可供性、环境-生态和谐性与市场综合竞争力在内的可持续发展重大集成性命题,促进电力行业和国民经济的高质量发展面临重大需求和显著意义。本文基于数据驱动的方法对火电厂锅炉燃烧建模和优化。通过对电厂历史运行数据进行数据挖掘,建立锅炉关键变量与目标变量(锅炉效率和NOx排放)之间关系模型,并在此模
学位
随着风电装机容量和渗透率的不断提高,接入电网的迫切需求与电网有限的承载能力之间的矛盾日益凸显。当风电发电量过高而电力系统难以消纳时,会产生严重的弃风问题。氢能作为引领绿色革命的主体,近年来在电力系统中得到了广泛的应用。在负荷的低谷时期利用风电制氢,可以有效缓解弃风问题。由于受到技术和材料的限制,目前制氢技术的效率普遍偏低,制氢的经济性较差,导致风电制氢的成本增加。针对上述问题,本文围绕计及制氢效率
学位
随着“3060”双碳目标的提出,风能作为一种分布广、储量丰富、绿色环保可再生的新能源,迎来了巨大的发展机遇,我国的风电机组装机容量和风力发电量迅猛增加。然而因为风力发电机组的工作环境恶劣、工况复杂,其机组部件容易出现故障,导致风电机组运行经济性下降甚至停机。风电齿轮箱作为风力发电机组传动系统的核心部件,始终工作在重载、高强度的条件下,其故障比率在风机故障中占比极高。因此对风电机组齿轮箱进行早期故障
学位
法院在履行判决中确定履行期限时享有司法裁量权,但因该事项涉及行政权与司法权的关系协调问题,又因行政程序法规则的空缺,给法院的司法裁量带来挑战,相关司法实践亦未给出明晰的确定思路。对此,发圣公司案判决揭示了裁量确定履行期限的多层次规则:首先,法定期限应被视为确定履行期限之基准;其次,无法定期限时,可参照《行政诉讼法》第47条设置的两个月的期限;最后,可结合当事人合法权益保护的及时性和行政机关履职的可
期刊
心律失常是心血管疾病中常见的临床表现形式,基于患者心电图(ECG)实现心律失常的自动分类在医学领域具有重要意义。近年来,深度学习模型在心律失常辅助诊断领域取得初步成功,但大多数模型在提供优秀准确率的同时由于缺乏结果的可解释性而难以实际应用。本文利用所谓的事后可解释性,通过对训练过程中产生的结果进行可视化,暗示模型学到了哪些知识,从而为研究人员提供有用的信息。因此本文主要研究工作如下:(1)基于双层
学位