论文部分内容阅读
在线社交网络在近年发展迅猛,在线社交平台和社交媒体功能更加细化。然而由于影响信息传播的因素复杂多变,发现影响信息传播的关键节点以及对信息的传播进行进一步的预测工作成为研究的热点和难题。社交影响力描述了用户在社交平台上对他人的影响大小,社交影响力大的用户在信息传播的过程中往往充当着重要的作用。转发预测就是根据信息现有的传播形式,预测未来一段时间内哪些用户会参与到信息的传播过程中。现有的转发预测算法大多从宏观角度进行研究,采用概率、阈值等方法分析信息传播的扩散速度,而没有针对具体的节点进行分析研究。鉴于以上原因,本文研究社交网络信息传播过程中的关键节点和转发预测问题。具体的工作如下:(1)社交网络中信息传播呈现明显的级联关系,为了更好的了解信息的具体传播机制,在获得信息传播数据后,构建信息传播的拓扑结构,分析信息传播过程。(2)在对PageRank算法分析的基础上,设计了 NodeRank算法,使其更适合由信息传播构成的复杂网络结构,对参与信息传播的各节点影响力进行量化,挖掘信息传播过程中的关键节点。(3)信息传播过程中的关键节点是影响信息传播机制的重要因素,是造成信息大范围、快速传播的主要推动力。分析影响用户参与信息转发的相关因素,将这些因素分为文本特征、用户特征、交互特征和时间特征四类,并设计了部分特征的量化方法。(4)使用关键节点作为信息传播的源节点,预测用户的转发行为。使用分类思想,根据已有的转发节点,基于SVM分类模型,对尚未参与到信息传播的节点进行转发预测分类。(5)在真实数据集的基础上,对关键节点挖掘和信息转发预测做对比实验,并对实验结果进行分析。本文整体上分析了信息传播过程中的关键节点挖掘和用户转发预测两个问题。在关键节点挖掘问题上,主要解决了如何度量节点的社交影响力问题;在用户转发预测问题上,主要研究与量化影响用户节点参与信息传播的因素,用关键节点作为引起信息传播的节点,用SVM分类模型预测该节点的粉丝节点或是有交互历史的节点是否会参与到信息传播过程中。