论文部分内容阅读
近年来,各种在线社会网络蓬勃发展,微博作为一种新型的在线社会网络,以其简短快捷的信息分享方式吸引了全球数亿用户。微博的流行不仅改变了用户的信息交流习惯,催生了新型的媒体传播方式和网络营销模式,也引起学术界对微博的关注和研究。微博用户群体数量庞大,不同用户在网络中地位不同。微博中信息传播和更新速度快,存在信息超载现象,因此通过用户影响力的评估来进行用户推荐,不仅能有效降低微博网络中信息超载的现象,而且还能有力支持在线社会网络中信息扩散和传播模式的研究。为此,设计并实现了一种基于投票的微博用户影响力量化算法——WeiRank。WeiRank算法从由用户关注关系构成的微博网络拓扑结构的角度出发,采用多轮迭代投票,加权投票的方式,计算微博中用户的影响力值。研究采用新浪微博中真实的数据,对用户的粉丝数、关注数、绝对互相关注率和相对互相关注率等数据进行统计分析。结果显示微博网络中不同类型的用户拥有的影响力不同,且微博中存在一个由影响力大的用户组成的核心。该核心吸引了微博网络中大部分用户。通过对微博用户影响力特征的研究,总结出两点衡量微博用户影响力的指标:影响力覆盖范围和被影响者本身影响力。在了解微博用户影响力的特征后,借鉴投票模型,设计并实现了基于投票的微博用户影响力量化算法WeiRank。该算法综合考虑了影响力覆盖范围和被影响者自身影响力两个因素,对用户赋予了影响力和识别力两种属性。算法的核心思想是用户的影响力等于关注该用户的人的识别力之和,用户的识别力等于该用户所关注的人的影响力之和。将获取的新浪微博用户数据根据用户粉丝数分为三个不同的数据集。在三个数据集上分别运行了WeiRank、PageRank算法和HITS算法。实验结果验证了基于投票的微博用户影响力量化算法的可行性和收敛性,并通过与PageRank算法和HITS算法的结果对比分析,证明了基于投票的微博用户影响力算法WeiRank更适用于微博网络。