论文部分内容阅读
微博是microblog的简称,是一个基于用户关系的信息分享、传播及获取平台。随着Web2.0的发展,越来越多的人们开始关注和使用微博。微博作为一个近年来兴起的在线社会网络,吸引了众多的学者对其进行研究。微博既具有媒体传播特性,又具有社交网络特性,因此可以从社会网络、新闻传播等多个角度对其进行分析。作为一个在线社会网络,本文对其网络结构进行了分析,并提出了一种新的评价微博网络中节点影响力的算法。本论文的主要工作有以下三个方面:首先,对微博网络的结构进行分析,发现微博网络的度分布服从幂率分布,并且具有胖尾特性。微博网络具有高聚类系数、小世界等特性,这说明微博网络具有复杂网络的特性,可以使用复杂网络分析的方法对其进行分析。其次,对微博用户发表微博的行为进行分析,发现用户发表微博的活跃度服从幂率分布,这与近年来在人类行为动力学研究中发现的用户行为时间间隔分布服从幂率分布且存在胖尾特征相同。从而对人类行为动力学在微博研究上提供了实证分析。再次,本文基于PageRank算法的思想提出了一种新的评价微博网络中网络节点影响力的算法Behavior-Relationship Rank,该算法基于用户发表微博的行为以及用户之间的关系,计算网络节点的BRR值。我们在Hadoop分布式计算平台上通过MapReduce实现了该算法,使用分布式计算环境能有效的减小大规模数据分析所花费的时间,提高数据处理工作的效率。通过评价网络中节点的影响力,我们可以找出网络中信息传播的关键节点,这有助于我们研究微博网络中的信息传播,为微博网络的舆情监控提供帮助。作为一个新的传播平台,微博在应用及研究上都具有广阔的前景,特别在新闻传播、信息推荐、用户行为分析及人类动力学等方面。研究微博的目的就在于发现其在应用及研究中的潜在价值,这也是推动我们不断进步的动力。