互联网虚假新闻检测关键技术的研究及应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:girl_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,新闻的载体逐渐由报纸向网络新闻转变,人们也更倾向于使用电脑和手机去接收新闻消息,互联网给人们带来便捷的同时,也为虚假新闻滋生提供了温床。自媒体的发展,使互联网新闻内容的呈现方式愈发多样,常常包含文本、图片和评论等各种信息,如何有效利用这些信息进行虚假新闻检测,对维持社会稳定、净化网络空间有重要作用。虚假新闻是可被证假且故意传播的新闻报道,传统的虚假新闻检测方法往往只关注单一模态信息,基于多模态的虚假新闻检测研究还处于早期阶段。现阶段的检测方法大多从新闻文本分类或者社交网络传播的角度去建模,而多媒体新闻丰富的内容,使得基于单一模态的检测方法还存在提升的空间。基于此,本文以微博多模态数据集为例,提出了一种融合了多模态信息的虚假新闻检测框架,并在具体的数据集上展示建模过程和分析结果。本文的主要工作内容和贡献如下:提出了基于多模态虚假新闻检测框架MFND,分别从文本、图像和用户上下文三个模态进行特征的提取。文本特征提取基于BERT模型,通过全连接层对提取的文本特征进行微调使其更好表征新闻的语义;图像特征提取利用DenseNet预训练模型抽取图像内容卷积特征,同时使用DCT算法抽取图像的频域特征,用以表征图像的篡改、重复压缩信息;用户上下文统计特征基于特征工程,挖掘用户的行为特征和新闻统计特征。最后将不同模态的特征拼接后输入到前馈神经网络中训练,最终模型的准确率和F1值分别达到96.32%和95.85%。提出改进的融合注意力机制的多模态虚假新闻检测框架attention-MFND,在MFND的基础上,从挖掘图文相关性和图文特征交叉的角度出发,引入注意力机制,通过图像特征(query)与词向量(key)为文本中的词向量分配权值,加权平均后得到融合了图像和文本信息的特征向量,将其加入到多模态特征集后,模型检测效果得到了提升。最终模型的准确率和F1值分别达到97.91%和97.52%,验证了该框架的有效性,同时基于attention-MFND开发了虚假新闻检测的Web服务。
其他文献
企业资源计划(ERP)在企业信息化建设中占有重要地位,在汽车、航空、船舶、电子、等制造行业应用得特别广泛,通过建设生产与物料管理系统,实现供应、生产业务流程一体化和产供销之间的紧密衔接,实现生产过程的有效管理,加强生产过程的质量管理和成本控制。实现信息共享,不断提高公司管控能力。一个完整的生产与物料管理系统的实施主要分为五个阶段,分别是项目启动、需求调研、蓝图设计、系统实现与测试、项目验收,每个阶
在国家“互联网+”战略的推动下,政企市场向个性化、多元化、高融合化的趋势发展,正处在新一轮科技革命的通信运营商,为响应政企市场需求的变化,打造了以5G、云计算、大数据、物联网、人工智能等新一代技术为核心的创新业务体系,但因为创新业务具有较强的专业性、复杂性,宁夏联通现有的组织体系及运营管理已经不能适应市场的变化,亟待解决当前面临的支撑人员不足、支撑效率不高、响应速度不及时等问题,只有解决了这些创新
越来越多的企业和组织开始重视项目的沟通管理工作,究其原因就在于成功的项目通常都有一个和谐的沟通氛围,项目内外部的沟通都较为顺畅。对于项目管理人员而言,除了完成项目的基本工作之外,更多时间都在进行沟通和协调。大多数项目管理工作的开展或多或少都会受到不同程度的干扰,有的来自项目内部,也有一些来自于项目外部。当面对项目中的冲突时,项目管理人员需要收集和分析相关信息,拟定出科学的沟通计划,并运用巧妙的沟通
在当今信息技术飞速发展的背景下,信息技术、智能算法、互联网等技术深入融入工业领域已经成为大趋势。全球各大主要经济体都对这个趋势做出了回应,德国有“工业4.0”、日本有“新制造业”、美国的“工业互联网联盟”和“先进制造伙伴计划”以及中国的“中国制造2025”和“互联网+先进制造业”等等。本文以和云南某公司的仓库数字化项目做研究背景,探讨在生产物流领域中仓库储位分配问题的解决和实现,结合实际问题,建立
随着智慧城市信物系统的不断演进和信息技术的快速发展,越来越多的、异质的网络被建立起来,深入了人们的日常生活。如今,人们对网络质量的要求也变得越来越严格,因此,网络传播动力学以及拥堵问题研究逐渐引起了学者的兴趣。随着复杂网络理论的发展,现实复杂系统的网络得以使用复杂网络模型进行表征,从而可以借助复杂网络模型研究智慧城市信物系统的传播动力学以及提高网络质量。目前,许多实证研究表明,网络性能不仅与网络结
近年来,中国经济高速发展,这背后离不开国家政府的经济规划与产业政策制定,经济政策的变动一直被社会各界紧密关注。然而目前仍然缺乏一套可以定量刻画政策变动的指数体系,如何对政策文本进行科学地量化分析一直都是政策研究的主要内容。传统的政策量化研究方法大多仅从时间、空间两个维度对政策进行统计分析,对研究人员的分析能力依赖程度高,且主观性强、成本较高,不能有效地挖掘政策文本信息。围绕这一问题,本文基于政策文
随着科技的发展,目前物流业已普遍引入信息技术,对仓储、运输、配送等过程产生的信息进行自动化的采集、汇集、分析,其货运模式向核心平台经济转变,新模式“无车承运人”在国内诞生。作为货运经营者,无车承运人平台需要介入货运交易,与实际承揽货运的车主进行运费议价,从而保证利润最大化。随着物流运输行业订单的日益增长,影响货运价格的因素越来越多,采用传统的线性公式计算运费参考价,并电话联系承运司机就运输订单进行
房屋市场是资源分配问题中研究最为广泛的模型之一。传统的房屋市场模型包括了n个参与节点和n个不可划分的资源,这些资源统称为物品。每个节点都持有其中一个物品,并对市场中的所有物品有一个优先级排序。房屋市场的相关问题主要是考虑在这样一个简单模型下,如何设计算法或是机制,有效利用排序信息,通过无金钱参与的交换,找到满足某些市场或是个人需求的分配。在本文中,我们主要研究了一个房屋市场变体模型中的物品可达性问
近些年来,随着信息技术的迅猛发展,反映国家经济活动的高分辨率数据越来越多,从而涌现了许多探索国家经济发展的研究。大量实证研究表明,国家经济与疾病、环境、贸易、教育、科学研究等各方面的活动息息相关。技术创新也是关乎国家经济发展的重要因素之一,但目前技术创新与经济增长关系的研究仅仅停留在相关性分析上,没有深入到预测层面,且大规模、长时间跨度的定量分析仍然缺乏。为了弥补上述缺陷,本论文旨在利用专利这一丰
随着时代的发展,越来越多的人选择走进博物馆,或是享受历史博物馆带来的文化熏陶,或是感受科技博物馆带来的知识魅力。所以博物馆如何更好得服务参观者,用有限的展示空间去尽可能满足游客的参观需求成为很有意义的研究方向。传统的研究方法可能大多局限于问卷调查和人为询问,使得参观者和博物馆工作人员都不太便捷。所以本文主要研究如何结合现有的人工智能技术来获取参观者对博物馆展品的评价,方便博物馆优化其展品的展陈。一