论文部分内容阅读
图是一种非常重要的数据结构,能够充分描述自然界中各事物之间的联系和依赖属性,因此图在计算机领域中广泛应用。很多诸如网络路由、网络流等问题都可以图论的支撑下,借助相关算法得到高效解决。随着Web2.0、大数据、社交网络、机器学习和数据挖掘(MLDM- Machine Learning and DataMining)等技术的高速发展,很多领域抽象出来的图规模呈指数级增长,图中的结点、边及权重爆发式地达到亿万级别,对图计算性能提出了新的要求。本文从图计算框架理论基础BSP框架分析,剖析了目前的分布式图处理平台处理海量Natural Graphs的算法与性能,提出将图中边组织并组到一个“grid”中展示和图分割模式的GridGraph图计算系统,实验表明GridGraph系统的图计算性能与表现上超越单机图计算系统,甚至比需要更多资源的主流分布式图形处理系统更快。