基于图模型信息增强的立场检测研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zxhouxingzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
立场检测旨在给定的目标话题下,自动判断用户意见文本的立场态度(如支持、反对等),这对了解民众意愿、政府决策和智能推荐等具有重要意义。目前,深度神经网络模型由于其出色的性能得到广泛的应用,但文本外的大量信息仍未得到很好的挖掘与运用,特别是社交媒体中的用户信息交互等方面。本文的研究内容主要包括以下三个方面:(1)研究基于上下文关联关系的立场检测针对上下文信息交流单一而导致的交互信息易被忽视问题,本文基于逻辑学原理扩充上下文交互信息,并利用图卷积网络构建相应的图结构。首先,采用最大池化、双向长短时记忆网络,提高模型提取文本中的语义特征能力。其次通过自注意力机制动态调整特征权重。最后,通过扩充原始上下文回复关系丰富上下文关联关系,并利用图卷积网络挖掘文本交互信息,提高上下文信息的关联性。实验结果表明,基于上下文关联关系的模型性能较好。(2)研究基于用户关联的立场检测针对用户信息利用不充分且未能有效结合现有文本的问题,本文挖掘文本背后的用户信息,并建立文本与用户信息的语义特征。本文从增强自身信息和关联文本背后信息两方面来提升模型的性能。本文使用注意力机制增强与用户的感知表示,并通过挖掘用户信息构建基于用户的图网络,利用卷积操作挖掘相同用户下相似文本的立场信息,从用户角度提升不同文本间的相似关联。本文在辩论数据集上进行了实验,结果表明了基于用户关联模型的有效性。(3)研究基于依存句法关系的立场检测针对语句中不同成分间联系较弱,模型难以完整地识别语句中不同成分的句法关系问题,本文提出利用依存句法关系增强句子中多个成分之间的信息共享,并设计了一种基于句法依存关系构建的图结构。同时为了解决句中不同成分信息的重要程度问题,本文引入图注意力网络,通过对邻居节点做聚合操作,进一步对不同邻居权重自适应分配,并结合基于用户的图结构,提高立场检测模型的性能。最后,考虑到数据集的普适性与依存关系模型的实用性,本文还搭建了一个基于依存关系的系统,使得系统应用于更广泛的数据集。综上,本文从多层次信息角度出发,通过构建拓展上下文关联关系、构建用户关系和依存句法关系的角度分别对基于图卷积网络进行研究,以解决不同信息利用问题和图模型构建问题。最终,本文提出的基于图模型信息增强的方法取得了一些初步成果,希望这些研究能为立场检测任务带来一些帮助。
其他文献
后摩尔时代的集成电路特征尺寸已经进入量子效应显著的范围,传统的硅基芯片已经接近了性能极限,而碳基芯片的计算速度是硅基芯片的3-5倍,具有室温下导热性好,承载电流上限高,频响快等优点,因而碳纳米管(Carbon Nanotube,CNT)成为了有望替代硅的材料之一。以半导体型单壁碳纳米管(Single-Wall Carbon Nanotube,SWNT)为构建单元的晶圆级别碳基芯片,在自下而上和自上
学位
湿法微玻纤毡因其优异的隔声性能,在建筑隔声、航天航空等领域具有重要的应用价值。微玻纤在水中容易相互缠绕,从而出现絮聚、团聚等现象,这会影响复合毡结构的均匀性,导致复合毡性能下降,同时未添加黏结剂的微玻纤毡机械性能较差,黏结剂的大量使用存在水污染等问题。因此探索新的制备工艺,实现微玻纤毡质量均匀、结构稳定和制备出机械性能优异,声学性能优越的微玻纤复合毡是本课题的出发点。本课题通过对湿法工艺的设计,制
学位
采用氯化铵(NH4Cl)溶液浸出生活垃圾焚烧飞灰中钙后,再用碳化法对其进行回收。通过单因素实验和响应面设计获取钙离子浸出的最佳条件为:NH4Cl浓度为3.9 mol/L,反应时间为64 min,液固比为5.6 mL/g; 3个因素对Ca2+浸出的影响程度排序为液固比>NH4Cl浓度>反应时间。飞灰残渣重金属毒性浸出结果表明:Pb、Cu、Zn、Cd、Ni浸出浓度分别为0.0929,0.0012,0.
期刊
接插件是许多工业设备的基础器件,其质量优劣直接影响到工业设备的运行。接插件生产设备的温度与接插件质量关系密切,温度过高会降低接插件品质。在传统接插件的生产工序中,常采用人工测温的方式对设备进行监测,若设备温度未超出阈值范围时,再凭借个人经验调节设备运行速度以提升产量。但这种方式会耗费人力、浪费生产材料、无法准确提产。本文基于无线传感网(Wireless Sensor Networks,WSH)与无
学位
基于视频播放的景观照明是日益发展的数字城市的有机组成部分。随着通信技术、芯片技术、软件技术的不断演变,景观照明控制技术也在不断更迭之中,向着灵活配置、远程操作、云端维护等方向发展。本文基于新一代远程数据通信技术CAT.1及国产RISC-V内核短距离无线通信MCU,设计与实现了一款远程可维护及更换视频节目、可配置播放参数、边缘分布式节目存储的景观照明控制系统,主要工作如下。(1)基于通用嵌入式计算机
学位
元学习也叫学会学习,能够在已有知识的基础上快速获取新知识,适应新任务,是近年来机器学习领域的研究热点。在多数实际场景中,无标签数据比有标签数据更容易获得,因此,半监督思想被逐渐推广到元学习中。尽管现有的研究已经取得了一定的成果,但仍存在特征利用不充分、原型(类别表示)的代表性和可区分性不强以及无标签数据的利用方式不够完善的问题。本文通过自主设计的增强策略针对现有的半监督元学习算法存在的上述问题进行
学位
随着大数据时代的来临,数据更新速度快且具有多样性。如何对数据进行有效特征提取是数据预处理中必不可少的一个环节。特征选择是数据降维的主要方式之一,其目的是为后续的学习任务选择具有最佳判别能力的最优特征子集。目前,Fisher得分是一种简单有效的过滤式特征选择方法,其主要思想是寻找使得数据类内散度最小和类间散度最大的特征子集。Fisher得分最大的特点是不依赖于学习模型,可以直接和分类算法衔接。但是,
学位
互联网技术的快速发展让人们不仅能够从互联网中高效获取大量信息,还可以不断地产生信息上传到互联网,从而导致了互联网上信息数据的爆炸式增长。推荐系统作为解决互联网信息过载问题的关键技术,其核心思想是通过用户历史行为数据挖掘出用户的个性化偏好,从而为用户推荐其感兴趣的物品。在推荐系统中,协同过滤算法因其具备较强的可解释性以及领域无关等优势而被广泛应用,其实现一般可分为两个阶段:相似用户搜索阶段和评分预测
学位
事件抽取是自然语言处理领域的一项基本任务,其目的是抽取文本中事件的触发词及其论元,抽取的事件信息能给知识图谱、对话和问答等下游任务提供有力的帮助。近年来,随着深度学习技术迅猛发展,替代传统静态词嵌入的预训练技术随之兴起。借助预训练模型,研究事件抽取开始有新的方向,利用问答去进行事件抽取就是一个新思路。在新方法应用到事件抽取任务上取得成效的同时,一些问题也亟待解决。譬如,句子级事件抽取模型先验知识有
学位
推荐系统是互联网快速发展的产物,它可以帮助用户在信息过载的情况下从项目池中寻找满足偏好的项目。由于传统的推荐系统是利用交互历史来估计用户意图,因此这种静态方法存在无法捕获兴趣漂移、只能被动获取用户偏好等缺陷,这些限制不可避免地影响了推荐系统的性能,而通过在推荐系统中引入对话可缓解上述问题。本文致力于研究对话推荐方法,即主动与用户进行对话来动态捕获用户偏好,最终实现在有限轮次内向用户推荐合适的项目,
学位