论文部分内容阅读
随着互联网的发展,越来越多的人选择在在线社交网站中发布信息、分享资源,通过个体间影响力的作用可以实现信息传播最大化。因此,对个体间影响力的研究在市场营销、社会学、政治学等领域都具有重要的意义。论文主要研究了影响力用户的度量机制和信息传播的预测方法,实现了潜力成员的推举预测和帖子流行度的预测。论文主要工作如下:(1)针对社交网络中有潜力的影响力成员的推举预测问题,引用“谷歌”计算网页重要性的PageRank算法,提出等级声望度的概念,在考虑成员活跃度(出度)和欢迎度(入度)的基础上,加入等级声望度作为成员重要性的衡量属性。针对这样的多维属性查询问题,引入Skyline操作符,将数据集中的Infra-Skyline作为推举的候选集。然后,在对候选集中的成员进行推举预测的过程中,引入Skyline距离的概念,通过计算Skyline距离,得到成员不被支配的必要条件。同时,通过基于推举代价和支配性的裁剪策略,缩小了推举计划的搜索空间。最后,分别在真实数据集DBLP和WikiVote上进行对比实验,证明了算法的有效性。(2)针对帖子在社交网站中的传播问题,结合卡尔曼滤波器的基本思想,提出了预测帖子流行度的PMKF算法,将帖子最终转发总数作为帖子流行度的衡量标准。算法首先对帖子影响力进行预测,它主要分为两个阶段,第一阶段为预测阶段,利用上一时刻帖子影响力的最优估计值做出对当前时刻影响力的预测;第二阶段为修正阶段,通过观察帖子截止到当前时刻的转发过程,结合实际观察值对预测值进行修正,得到影响力的最优估计值。然后,通过构建未来信息级联树,对帖子未来转发量的预测可以被转化为一个等比数列求和的过程。从而实现对帖子流行度的预测。在真实数据集上的实验结果表明,该算法能实现对帖子流行度的有效预测。