【摘 要】
:
互联网的迅速普及打破了信息传播的专业门槛,使得越来越多的人们可以通过社交媒体方便地获取信息、分享和表达观点,这极大的丰富了人们的日常生活。然而,由于社交媒体的用户数量巨大,出于各种目的捏造的虚假新闻层出不穷。再者,随着技术的进步,虚假新闻不再单纯的以文本的形式传播,更多是通过文本、图片和视频结合的方式进行扩散,极大地增强了虚假新闻的迷惑性,也使得以往仅仅依赖文本内容进行分析的虚假新闻检测方法不再适
【基金项目】
:
国家重点研发计划:No.2017YFB1002804; 中国科学院前沿科学重点研究计划:NO.QYZDJ-SSW-JSC039;
论文部分内容阅读
互联网的迅速普及打破了信息传播的专业门槛,使得越来越多的人们可以通过社交媒体方便地获取信息、分享和表达观点,这极大的丰富了人们的日常生活。然而,由于社交媒体的用户数量巨大,出于各种目的捏造的虚假新闻层出不穷。再者,随着技术的进步,虚假新闻不再单纯的以文本的形式传播,更多是通过文本、图片和视频结合的方式进行扩散,极大地增强了虚假新闻的迷惑性,也使得以往仅仅依赖文本内容进行分析的虚假新闻检测方法不再适用。目前的大多数基于单模态的虚假新闻检测方法都将新闻帖子的文本内容视作词序列进行特征提取,一些基于多模态的方法则简单地拼接新闻的文本特征和视觉特征作为新闻的多模态特征进行虚假新闻检测。这些方法中的大多数都忽视了隐藏在新闻帖子文本内容中的背景知识,这些背景知识可以为虚假新闻检测提供辅助性信息。为了解决上述问题,本文基于图神经网络对多模态虚假新闻检测进行了如下探索:(1)本文提出了一个知识驱动的多模态图卷积网络(KMGCN)提取新闻多模态内容的语义表示。该网络可以将新闻的文本信息、知识概念以及视觉信息建模到一个统一的框架之中进行虚假新闻检测。对于新闻帖子的文本内容,我们将其转换为图结构数据,有助于建模非连续的短语,获取更好的新闻语义组合。除此之外,我们也将视觉信息以及从知识图谱中检索得到的外部知识作为节点,补充到图中,为虚假新闻检测提供互补的语义信息。我们使用一个精心设计的多模态图卷积网络来提取这些图结构数据的语义表示。两个公共数据集上的实验结果表明了该方法的有效性。(2)在第一种方法的基础之上,本文引入图注意力机制和预训练的BERT模型,提出了一个知识驱动的多模态自适应图卷积网络(KMGAN),对虚假新闻检测做了进一步的探索。相比于KMGCN中预定义的图结构,KMGAN使用图注意力机制动态地更新节点之间边的权重,有助于自适应地学习图的拓扑结构,可以有效地提高模型的灵活性。预训练的BERT模型相比预训练的Word2Vec模型可以提供上下文语义更加丰富的词向量,有助于提升模型的检测性能。两个公共数据集上的实验结果表明了该方法的有效性。为了更加客观地评价本文提出的虚假新闻检测方法,我们还设计了多种消去实验来证明模型中各组件的有效性,以及通过举例模型正确识别的多模态虚假新闻来阐明我们提出的方法在多模态虚假新闻识别上的优势。
其他文献
随着传感器技术的发展,单一传感器模式逐渐发展为多种传感器模式。然而单一的图像传感器表示能力十分有限,往往不能从场景中提取足够的信息,多源图像融合技术应运而生,提高了图像解译的性能。其中,多光谱和全色图像融合作为近年来的研究热点,在一定程度上解决了多源数据综合分析的问题,促进了图像处理技术的发展。该技术以互补的方式利用了这两种成像方法的特点,有利于更加准确、可靠、全面地获取目标或场景信息。对于多光谱
现代工程结构日益大型化、轻柔化,其安全服役和动力灾变问题越来越突出。结构可靠度分析和结构健康监测是保障工程结构长期服役和安全运营的两个重要研究内容:一方面,结构可能直接承受作用强度远超其设计极限的极端自然灾害,导致结构体系失效,因此有必要对结构进行动力可靠度分析;另一方面,在漫长的服役期内,结构会因环境侵蚀和材料老化等因素的影响出现功能退化,致使服役性能不断下降,因此需要利用损伤识别等手段为结构安
近年来,神经网络已经应用在无人驾驶、医学、地质探测等各个领域。随着卷积神经网络的发展,从Le Net网络结构到VGG网络结构,网络越来越深,每层的规模也越来越大,随之而来的是计算量和参数量越来越大的问题。一般神经网络的训练计算由服务器端进行,再将训练好网络发送到终端进行推理计算,以满足终端的智能化需求。但该传输过程可能会造成用户一些隐私数据的泄露,缺乏安全性,同时终端也缺乏本地的自我训练调整的能力
随着科技的发展,以及人工智能领域各项技术的逐渐成熟,多智能体系统已成为人工智能一个热门研究方向。多智能体系统由分布式人工智能演变而来,其研究目的是解决大规模、复杂、实时和有不确定信息的现实问题,而这类问题是单个智能体所不能解决的。多智能体深度强化学习是解决多智能体问题的重要方法,但目前的多智能体深度强化学习方法主要针对只有数个智能体的环境,而在多智能体越来越庞大的环境中,智能体的策略变得更加重要也
“十四五”规划纲要提出,要加大对大数据,工业智能,区块链等新基础设施的投资,信息化程度将进一步加深。网络信息科技也随之提升,然而有的人却会利用技术对人们的隐私与财产安全带来巨大威胁。网络信息安全面临全新的,繁杂的挑战。入侵检测系统作为网络安全领域的一个重要组成,在面对异常入侵,用户误操以及内部攻击时提供及时的防护,所以研究入侵检测系统已经成为相关从业人员重点研究方向。近年来随着深度学习在语音识别、
在工业生产中安全是首要任务,但日益复杂的工业现场环境给安全生产带来了极大挑战。当前工业现场常用的安全监测方法有:基于人工的巡查方法、基于机器视觉三维成像的目标识别方法、基于卷积神经网络的目标识别方法。人工巡查的检测精度、频率和范围都是有限的,因此基于机器视觉三维成像和基于卷积神经网络的目标识别方法得到了广泛应用,并能够运用于极端恶劣环境中,但基于机器视觉的三维检测方法自动化程度仍然不高,往往需要辅
老年人口的快速增加是一个迫切的社会问题。近些年来,科研人员在研究如何能够让老人在家中安全养老付出过很多努力。研究发现,行为识别是判断一个人是否具有生活自理能力的重要评估方法。该方法通过监测老人的行为可以得知其认知水平和健康状况,并在必要时能够及时做出预警。这对于提高老人的健康水平和居家生活质量至关重要。然而,要想能够尽可能准确识别老人的行为,至少需要准确的数据、合适的特征和符合老人活动规律的模型。
无线传感器网络(Wireless Sensor Network,WSN)常被应用于灾害预警、医疗监测、工农业生产、国防军事等各个领域。在WSN中,一方面节点电池容量有限导致网络寿命有限,另一方面广播特性使得通信干扰严重、吞吐量低,这两点是制约WSN大规模部署的重要因素,然而这两个问题相重叠使得系统模型更为复杂。为了有效提高网络吞吐量、延长网络寿命,本文提出将串行干扰消除(Successive In
化工园区作为一个易燃、易爆、有毒重大危险源高度集中的区域,一旦发生火灾、爆炸或毒物泄漏扩散等事故,将造成一系列的连锁反应,并产生灾难性的后果。为此,利用大数据、人工智能等高新技术提高化工园区风险感知、监测预警、协同救援和应急处置的能力,已成为新发展格局下的重点领域之一。其中,化工园区应急物资分配是开展危化品事故应急救援的基础,是体现化工园区应急管理能力的一个基本要素。主要研究在危化品事故发生后,如
高分辨率SAR(Synthetic Aperture Radar)图像在卫星遥感、灾害监测等领域具有重要实际研究应用价值,但实际SAR成像分辨率往往难以满足应用需求。传统SAR图像超分辨率重建方法对模型和先验知识要求较高,重建效果往往不理想;无监督式生成对抗网络模型通过训练学习高低分辨率图像之间映射关系,减少先验知识依赖,重建图像效果明显优于传统方法,但博弈对抗式训练方法往往会使重建图像产生“伪影