社会网络分析工具中的分布式最小生成树算法

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:sheygy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算是一种全新的IT服务模式,向大量用户透明地提供按需、弹性、高效用的多租户服务。云计算凭借其超大规模存储能力、超大规模分布式并行计算能力、较高的可靠性和可用性等特点赢得了科学界和工业界广泛关注并在其大力推动下,取得了巨大的发展。与此同时一个全新的互联网服务模式SNS (Social Networking Sites,社交网站)也得到迅速发展,一大批社交网站如Renren、Facebook等快速崛起。每天这些网站都会产生大量的用户数据,如何从这些用户数中发现具有商业价值的深层次有用信息日益成为这些网站重点关注的方向。SNA (Social Network Analysis,社会网络分析)是解决上述问题的有效手段,并成为众多学者研究的重点。但是现代SN (Social Network,社会网络)往往都是几百万甚至上千万的超大规模数据集,如何处理大规模的社会网络数据集成为传统的社会网络分析面临的一个较为严峻的挑战。为了对海量数据集进行社会网络分析,本文提出了X-RIME:种将强大的云计算平台Hadoop和社会网络分析法相结合的大规模社会网络分析工具,具有良好的扩展性和通用性。构建在HDFS (HADOOP Distributed File System, HADOOP分布式文件系统)之上的X-RIME数据模型以及构建在HADOOP MapReduce编程模型之上的X-RIME算法模型使X-RIME同时具备了海量数据的存储与处理能力。与此同时,基于X-RIME数据模型和算法模型开发的X-RIME算法库包含十几种MapReduce化的分布式社会网络分析算法,这些算法可以部署在成百上千台普通PC机上,是X-RIME大规模社会网络分析的核心。X-RIME算法库中的分布式MST (Minimum Spanning Tree,最小生成树)算法是社会网络分析法中较为重要的算法,在计算最优传递问题方面有着广泛的应用。本文首先对X-RIME的总体架构进行介绍,接着对X-RIME中数据模型和算法模型的设计与实现进行介绍,然后对X-RIME算法库中最为复杂和重要的分布式最小生成树算法的设计与实现进行介绍,最后给出X-RIME中分布式最小生成树算法的功能测试情况。
其他文献
随着移动网络的不断发展和移动智能终端设备功能的不断增强,使得上下文信息的获取成为可能,上下文信息是指任何可以用来描述实体所处环境特征的信息。通过分析用户所处的上下
基于P2P技术的实时流媒体系统主要包括以下两方面的研究内容:一是媒体数据块的传输调度策略,即媒体内容被分为大小相同的许多块,节点如何对数据块进行请求;二是覆盖网络的构
随着移动互联网的蓬勃发展,移动社交网络(Mobile Social Network Service, Mobile SNS)也逐渐流行起来。Scene Life系统就是在这样的背景下出现的。这是一个全新的Mobile SNS
随用户需求的不断提高,网络业务逐渐向多样化方向发展。为适应这种变化,未来网络的主要特征将呈现出融合性、异构性。而目前网络管理系统中的管理信息模型仍然是网络相关的,
在超深亚微米工艺下,长总线时延成为了影响系统整体性能的重要因素。然而,电路中寄生元件作用日益显著,严重的串扰效应,使得总线的实际时延加倍,因此,针对总线的串扰效应开展容错设
传统的交换网络将所有的业务和控制能力集中在交换机上,导致新业务的提供需要较长的周期,且仅提供简单业务无法产生足够的收益,于是,业务需求促使了下一代网络(NGN)的出现。
随着展馆管理的信息化、自动化及安全级别等的不断提高,传统管理方式中使用人工监控及采集数据的方式已越来越无法满足需求。传统的展馆管理方式无法实现对参观者及展馆情况
视频运动目标检测与跟踪技术是随着数字视频技术的发展而产生的一个新的研究课题,在国防安全、民用事业等领域有着广泛应用。粒子滤波算法本身适用于非线性非高斯动态模型,更
CRM (Customer Relationship Management客户管理),是在企业电子商务中流行起来的概念。通过构建CRM系统,企业基于对客户详细资料的深入分析,来提高客户满意度与销售业绩,从
Internet作为一个典型的复杂网络实例,对其宏观拓扑结构的特征分析是目前研究的主要内容和热点问题,受到了学术界的广泛关注。近年来人们在该领域的研究取得了长足的进展,但