基于深度学习的谣言检测及模式挖掘

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dsb5519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的快速发展,大量社会热点在以微博、论坛为代表的社交媒体平台迅速生成、发酵、和扩散。这些由普通用户产生的内容(UGC,User Generated Content),由于发布门栏低,缺乏监管,带来了虚假信息的泛滥。这些虚假的信息借助社交媒体平台广泛传播,误导群众,给网络秩序和社会稳定带来了严峻的挑战。如何利用技术手段对以社交媒体为代表的网络平台进行谣言检测是当前迫切需要解决的问题。传统的谣言检测方法主要是通过构建大量人工特征并利用机器学习算法进行谣言分类,这些方法需要耗费大量的人力并且传统的机器学习模型不能学习谣言动态变化的特性。近年来,深度学习在文本、语音、图像等领域取得了重大突破,给其他领域的相关研究带来重要的启发。  本文主要研究基于深度学习技术的谣言检测方法,并通过可视化的技术手段,对谣言检测任务中潜在的特点进行分析,挖掘谣言模式。主要的研究工作包括:  1.设计基于单层神经网络的消息级谣言检测方法,该方法首先通过文本的词向量表达,将文本映射成基于词向量表达的文本矩阵,并利用单层神经网络模型进行消息级谣言检测。实验结果显示,基于单层神经网络的模型相比于传统的方法提高了2.97%的准确率。  2.提出了基于层次化循环神经网络的事件级谣言检测方法,该方法引入微博的转发信息,将一个微博信息在时间维度上进行子事件的抽取,通过构建层次化的循环神经网络模型,同时学习谣言在时间和文本维度上的潜在模式,在谣言数据集上取得了95.6%的准确率,相比于传统的谣言检测方法提高了5.77%。另外,利用1个小时的数据,谣言检测的准确率就能达到93.28%,显示出我们提出的模型可以很好的运用于谣言的早期检测。  3.提出基于深度学习的模式挖掘方法,从谣言数据中挖掘潜在的模式。我们分别从定性和定量两个方面对抽取的模式进行了实验对比分析。基于深度学习挖掘的模式优于传统的基于特征选择的方法。基于挖掘的谣言模式,我们实现了一个实时争议性新闻发现系统。
其他文献
沉浸式远程交互技术侧重通过计算机协同工作和人机交互等技术,提供远程异地用户自然便捷的交互,实现远程真实人物呈现和虚实融合,提供远在千里也能感受面对面和近在身边的用户体
随着嵌入式系统和Internet的不断发展,在嵌入式系统中网络方面应用的需求越来越大,在很多嵌入式系统中TCP/IP协议是嵌入式操作系统必须实现的功能.该文针对以上的要求,以一个
在对各种传统的Unix/Linux进程迁移算法进行分析研究的基础上,对进程迁移机制提出三个方面的改进.第一,在转移进程状态数据和恢复进程执行方面,不做检查点直接转移数据至目标
对用户来说,网络安全体系中检测者和响应者同样重要。然而对两者的研究却大不相同,长期以来,响应技术的研究未受到重视。实际应用中的网络安全产品把响应模块的任务留给了用户完
随着Internet在社会各个领域的不断推广,以及骇人听闻的“网络黑客”事件的时有发生,使得曾经被我们忽视了的“网络安全”正日益受到业界的关注和重视。造成Internet网络不安全
在图象处理和计算机视觉研究领域中,目标物体的定位始终是一个值得探讨的问题。目标定位技术是数字图象处理领域中的一种新的应用,在诸如武器精确制导、医疗辅助诊断、人机交互
机器人足球比赛是体育与人工智能技术结合的产物,又是在人工智能学中出现的一个典型的分布式多智能体(Multi-Agent)系统。它主要研究在复杂动态环境中解决分散的多智能体之间
主动网络是一个全新的网络体系结构,其网络可编程特性给网络安全带来了严重的挑战.与传统被动网络相比,主动网络的安全保护更显得至关重要.分析了主动网络中存在的安全问题以
该文介绍了基于PCI总线的快速以太网适配器的设计和实现过程,主要涉及硬件电路设计和驱动程序编制两个方面.针对TCP/IP协议、网卡数据交流换流程、缓冲管理方案及PCI总线接口
数字校园是在传统校园的基础上,利用先进的信息化手段和工具,将现实校园中的各项资源数字化,形成的一个数字空间。其中的虚拟校园漫游系统,则是在计算机环境中,利用虚拟现实技术再