论文部分内容阅读
近年来,随着互联网的发展特别是移动互联网的加速推广,网络迅速渗入到人们日常工作和生活的各个方面。社交网络尤其是微博的快速发展,逐渐替代了传统媒体成为网民获取新闻事件和分享信息的主要媒介。在大规模的社交网络中,其自组织性和庞大的节点规模徒增了网络中信息传播演化的复杂性和随机性,使得传统模型和研究方法难以准确描述用户微观交互行为,也难以解释网络中信息传播和演化的宏观过程,致使大规模网络中信息传播过程的分析成为研究的一个难点和热点。鉴于此,本文使用交叉学科的思想和方法,对微博网络信息传播建模、信息传播趋势预测、突发时间预测、用户传播影响力评价等传播行为关键问题进行了深入研究,旨在发现大规模网络中信息传播行为的微观和宏观规律,建立信息传播模型,对信息传播过程中用户的影响力进行评价,并寻找对信息传播趋势和突发现象的预测方法。本论文有助于了解大规模网络中信息传播和级联演化的过程,通过对影响力分析和传播趋势预测,为信息传播控制、传播趋势评估、突发事件预警等问题的研究提供有力的理论支持。本文的主要工作包括以下几个方面: 1)对微博网络中的信息传播行为进行测量和建模研究,提出了一种新的话题传播模型TP-Model和一种信息级联演化模型TCM。基于新浪微博的匿名数据集,对影响信息传播的网络拓扑特征、用户行为特征以及信息传播的级联特征进行了测量分析。在此基础上,提出了TP-Model模型研究热点话题的传播过程,并通过真实大规模微博网络上的仿真实验,验证了TP-Model对大规模热点话题传播过程仿真的有效性。考虑信息传播的时间相关性,提出了基于生存分析理论的时问感知级联模型TCM,建立了信息转发的时间相关风险函数,并通过参数估计和级联生成迭代,对信息级联的演化过程进行建模。仿真实验验证了TCM能够准确模拟信息级联的动态演化过程。两种模型有助于进一步认识微博网络中信息传播过程和信息级联随时间的演化,也是后续研究信息传播预测工作的必要前提。 2)对微博网络中信息传播的趋势进行了预测研究。针对热点突发话题传播过程的预测问题,提出一种基于异步独立级联模型的TAIC模型,将宏观传播趋势的预测转化为微观层面对单个传播实例的二分类问题。通过对传播过程的社交特征、内容特征以及时间特征等进行量化分析,基于决策树分类,提出了对传播实例和时延参数的预测方法。实验表明TAIC模型能够成功预测话题相关微博数目在后续天数的变化情况,该研究能够应用于社交网络中的信息推广和舆论导向等实际工作中。 3)对微博网络中信息级联演化的突发时间进行了预测研究。通过分析信息级联突发现象的模式,提出了一种基于优化加权随机森林分类的突发时间预测方法;针对信息级联演化中突发现象、突发时间窗口以及突发期尖峰窗口等三个渐进的预测问题,给出了基于时间窗口粒度的预测方案;通过对真实数据集中的突发时间预测实验,验证了预测方案的有效性。对信息级联演化中突发时间的预测研究为网络舆论突发事件的预警提供了有效支持。 4)对微博网络中用户传播影响力的评价进行了研究。通过综合考虑转发时间、用户所在传播级联结构以及用户间的交互等影响因素,提出了一种基于随机游走模型的算法SIRank,来计算不同用户的信息传播影响力,基于微博数据集进行了影响力评价对比实验,对高影响力用户进行排序和对比,验证了SIRank算法的高效性。通过对用户传播影响力的评价,研究工作能够进一步应用于社交网络中关键传播者发现等工作。