论文部分内容阅读
微博属于在线社会网络的一个新兴产品。近几年来,这个具有强烈“自媒体”属性的互联网应用,凭借其弱连接、开放性、便捷性、即时性等特点,发展成重要的社交媒体,对社会发展产生了深远的影响。研究微博网络信息挖掘与传播技术对微博网络营销、舆情监控及控制不实微博舆论有着积极意义。选取复旦大学、上海大学和上海外国语大学的新浪微博用户作为研究对象,介绍了微博网络用户数据、微博信息数据及用户间关注关系的获取方法,提出一种关联算法用于局域微博网络用户身份的认证,提出改进的最近邻节点平均度值nn算法判断度-度相关性,采用中位值计算节点的平均入度。从实证分析角度进行了微博网络的拓扑结构测量及微博用户行为测量,发现微博用户关系网络具有复杂网络特征,表现出小世界效应和无标度特性。接着从信息传播角度,定义了传播矩阵的概念,综合考虑用户直接号召力、影响范围及平均信息负荷量等参数,提出全新的微博网络关键节点挖掘WeiboRank算法。基于微博信息传播模型,对PageRank、betweeness centrality、closeness centrality、Out-Degree、WeiboRank五种关键节点挖掘算法进行了性能比较与评价,发现WeiboRank算法获取的关键节点具有更广的传播范围,更优的影响力。构建出更贴合微博网络信息传播真实情况的ISMR(Ignorants-SpreadersMultiple Retweeters-Rejecters)模型,详细介绍了该模型的传播机制,对均匀网络和非均匀网络中ISMR模型的传播阈值进行了数学推导,结果表明,无论传播率有多小,信息都可传播扩散出去。仿真分析了ISMR模型在BA无标度网络及真实微博用户关系网络中,无知节点、传播节点、多次转发节点及拒绝节点随时间的密度变化情况。提出一种新的WR免疫策略,仿真研究了免疫种子节点密度g、免疫延迟时间对信息传播的影响。仿真结果表明,与随机免疫和目标免疫相比,WR免疫可以更为有效地抑制不实信息的传播。探讨了影响用户转发行为的两大因素:用户特征及微博信息特征,采用SVM方法进行转发行为预测,并在此基础上,结合网络的用户关注关系进行微博信息转发规模的预测,取得了较好的预测效果。对微博信息传播进行可视化分析可以更为直观的观察微博信息传播路径,分析归纳出“蒲公英”、“双星”和“多极点”三种信息传播模式。提出基于各节点WeiboRank数值之间的关系,判别信息传播模式类别的方法。