论文部分内容阅读
随着社交网络的普及,例如微信、微博、QQ、Twitter和Facebook等社交网络相关的应用已经渗透到人们日常生活中的方方面面。目前,它们已成为人们日常交流的常用工具和获取信息的重要途径。社交网络中的信息传播具有速度快、范围广和实时性强的重要特征。由于虚拟世界和真实社会信息的不对等,造成一些真实性未经验证的信息(即谣言)“裂变式”的传播和扩散,影响国家安全与社会稳定。开展有效的谣言分析有助于缓解社会矛盾、减少突发性事件的负面影响、提高政府决策公信力和公共空间治理水平,进而推进社会健康和谐发展。本文重点关注检测社交网络中发表的言论是否是真实性未被证实的消息——谣言检测;对于检测到的谣言,进一步揭示人们对谣言的讨论反映出的对该谣言真实性的态度——谣言立场分类;然后溯源到被标记为谣言的消息的源头——谣言溯源;最后根据立场分类的结果和溯源过程中得到的结构信息检测谣言的真实性(即消息的真假)——谣言真实性检测。围绕这四项系列任务、针对不同任务下图结构表达和树结构表达方法各自的优势,本文研究了任务驱动的社交网络数据表达和神经网络模型,主要研究如下:(1)在谣言检测任务中,基于图结构表达和树结构表达的神经网络在谣言检测中各有优势,为了提取谣言会话中源消息和回复之间的全局结构特征和局部结构特征,本文分别从图和树的角度为每个会话构建源-回复结构表达。通过构建更侧重建模全局结构信息的图表达,提出了具有节点比例分配机制的集成图卷积神经网络(EGCN);通过构建更侧重建模邻域内节点回复关系的树表达,提出了源-回复会话树卷积神经网络(TCN)。分别将EGCN和TCN用于谣言检测任务,在谣言检测5个事件上测试EGCN和TCN模型的精度、准确率和F1值,实验结果验证了所提出的两个模型在谣言检测任务上的有效性。(2)谣言立场分类可以分为针对独立消息的立场分类情景和基于完整谣言会话的立场分类情景,本文以注意力机制为核心手段,分别提出了针对两类情景的谣言立场分类模型;首先,根据文本的信息粒度和公众的阅读与表达习惯,面向单一消息提出了基于随机注意力卷积神经网络(SACNN)的谣言立场分类模型;然后,面向完整的会话,从建模回复之间的邻域结构信息的角度,构建规则化的树表达并提出了基于注意力树卷积神经网络(ATCNN)的谣言立场分类模型。在公开数据集的8个社交网络事件上进行的对比实验和消融实验验证了上述两种模型在谣言立场分类任务上的有效性。(3)在谣言溯源任务中,本文从模式识别的角度将溯源问题转化为社交网络中节点的类别预测问题,提出了面向谣言溯源的高阶图自注意力神经网络(HGAT)模型,利用节点不同阶的邻域结构建模谣言在社交网络中的传播特性和结构信息,从而实现针对不同结构社交网络的溯源任务。在5个不同规模的真实数据集上进行的对比实验和消融实验的结果表明本文提出的高阶图自注意力神经网络能够以更短的错误距离提高谣言溯源的准确性、且适用于不同的传播模型。(4)在谣言真实性检测任务中,本文从多任务学习和结构信息建模的角度出发,首先,将不同结构的谣言会话构建为相同结构、具有不同邻域节点特征的规则化的谣言会话树(RC树);然后,根据谣言会话中立场特征对谣言真实性检测任务的辅助作用,提出了基于RC树的多任务自注意力树卷积神经网络(MATCN),MATCN通过构建树自注意力机制实现节点分类任务(立场分类)、通过构建会话树卷积和会话树池化方法实现RC树的分类(真实性检测)。另外,基于多任务学习框架,MATCN还借助立场特征进一步优化真实性检测的结果。在公开的谣言真实性检测数据集上进行的对比实验和消融实验的结果表明MATCN相比于其他基于图和树的神经网络能够提高谣言真实性检测的准确性。