论文部分内容阅读
                            
                            
                                互联网应用的发展,从电子邮件、BBS、门户网站,到搜索引擎、即时通信、电子商务,再到如今方兴未艾的社交网络。由于社交网络的快速发展,新兴的创业公司及业务层出不穷,使得社交网络的应用多而繁杂,为了便于本文后文的研究,有必要对目前国内的社交网络进行梳理和分类。由于目前尚未有统一的分类标准,根据各社交网络网站的核心业务,本文将社交网络分为7个大类和21个小类,并对那些新兴的、具有发展潜力的社交网络做了详细的介绍。随着新浪博客、新浪微博、腾讯博客、腾讯微博等社交网络平台的发展,科学而又有效地评价用户在不同平台间的综合影响力能够产生一定的经济价值和新闻价值。社交网熵指数算法用来分析多平台间用户影响力,其应用信息熵有效地解决了多平台间信息传递不均衡的问题,但该算法仍存在不足,其没有解决不同平台对用户影响力的影响的差异性问题。  
 本文针对该问题,在社交网熵指数算法的基础上,给出了平台影响力权重系数。本文使用世界著名的Alexa网站流量排名系统给出的用户访问数、页面浏览数和二级域名用户访问比例三个重要指标,计算得到平台影响力权重系数,以对社交网熵指数算法进行改进,并应用从社交网络影响力排行榜网站采集的新浪博客、腾讯博客、新浪微博、腾讯微博四个平台的100组数据,对算法改进前后的用户影响力排名进行实例对比分析,证明了该改进的合理性和有效性。鉴于目前国内的博客平台在用户影响力排行榜方面的缺失,及其使用博客访问量这单一指标,所推出的博客流量排行榜未能真正反映用户影响力,因为高流量并不等于高影响力。随着传统互联网向社交网络的发展,网站的社交属性才渐渐被注意到,关注入气这一指标被给予越来越多的重视。本文同时考虑博客访问量和关注人气这两个核心指标,应用多元统计分析方法中的主成分分析法,以新浪博客为例,从新浪博客总流量排行榜采集500组用户数据,对用户访问量和关注人气两个指标进行分析,综合得出各用户影响力并进行排序。对新得出的用户影响力排行榜与新浪推出的新浪博客总流量排行榜进行对比分析,证实了所采用的方法能够更客观和有效地评价用户影响力。