论文部分内容阅读
随着互联网技术的快速发展,在线社交网络成为一种新的信息发布和共享的服务平台,逐渐成为人们日常学习、生活中的重要组成部分。由于这些平台发布信息的门槛较低,且信息多样化、表达自由化,使其成为谣言的产生与扩散的绝佳平台。而恶意的谣言往往具有一定的危害性,容易引发社会恐慌,这对社会的进步、国家的发展尤其不利。社交网络中,不实信息的泛滥特别是谣言的充斥已近成为日益突出的社会问题。现有的谣言检测方法主要采用传统的机器学习方法进行检测,这些方法都需要大量的数据标注。然而,微博文本内容短且具有随意性,这些特性使得大量且有效的标注数据非常难以获取,标注样本又非常费时费力。再者,人的主观因素容易导致其对谣言产生误判。与此同时,微博信息更新迅速,能够被有效标注的数据已经不足以训练得到一个可靠的分类模型。迁移学习是运用已存有的知识来实现对相关领域问题进行解决的一种机器学习方法。而意见评论检测的数据与方法与微博谣言又具有一定的相似性。随着迁移学习的出现,传统机器学习中的两个基本假设被打破,为解决上述问题提供了可能。目前迁移学习主要应用于图像处理等领域,如何有效实现迁移学习在谣言检测领域的应用,也成为一大难点。针对以上问题,本课题针对Twitter中充斥的谣言进行识别与检测,采用迁移学习方法,将评论中的知识进行迁移,以此实现目标域(即谣言检测领域)的有效分类。主要工作内容如下:首先,需要对源域与目标域数据进行数据处理与分析。其次,本文提出了一种基于卷积神经网络(Convolution Neural Network,CNN)的深度迁移模型来实现对Twitter中谣言的检测。具体来说,本文给出了一种学习率自适应更新的方法来解决迁移过程中出现的负迁移现象。最后,使用深度学习框架TensorFlow实现了所提模型,在已标注谣言规模不足的情况下,构建了更为准确的谣言检查机制。经过实验验证,本文提出的模型在谣言检测上取得了更为准确的识别结果,可以作为一种有效的谣言检测手段应用于实际工作。