论文部分内容阅读
网格计算突破了现有的资源限制,将分布的资源组织起来,协同解决复杂的科学计算与工程应用问题,为用户提供了强大的计算能力,极大地推动了科学研究和工程实践的发展。网格可容纳的节点数量较大,且每个节点具有高度的自治性。在这样一个松耦合的分布式异构系统中,对资源进行有效地调度,保持良好的负载均衡具有重要意义。本文研究信息分发网格中基于副本的系统流量负载均衡问题,设计了信息分发网格的负载均衡子系统框架,解决了几个密切相关的问题,主要包括:(1)基于流言传播的新信息推送。流言传播算法是分布式系统中的一种更新传播算法。本文提出基于流言传播的信息推送算法,该算法具有较好的扩散速度,且每个节点转发消息的数量一样,因此是消息负载均衡的。(2)基于最近访问状态的副本创建和替换。网格的数据访问具有时间局部性,而现有的网格副本创建策略没有综合考虑副本的访问状态,因此没有很好地利用时间局部性。本文的副本创建和替换策略对数据副本的最近访问状态和使用频率非常敏感,因而出现时间局部性时,该策略会很快做出响应,在本地创建副本,避免了使用频率高的数据反复在系统内传输。另外,本文的副本创建和替换策略中的文件相对负载和副本价值计算都依赖于数据获取算法。(3)基于节点集负载均衡的数据获取。现有的网格数据获取一般是选择最优的副本,本策略则是根据各副本节点的负载,从不同节点获取数据的不同分块。在一次数据获取中,该算法保证了所涉及的多个副本节点的负载均衡,但仍有可能产生这样的节点集,该节点集的整体负载相对于系统其它节点是较高的。因此,提出基于副本迁移的负载均衡来进一步解决该问题。(4)基于热点副本迁移的负载均衡。基于信息分发系统的副本网络,该算法可以降低超负节点的负载,同时把热点副本均匀地分布到信息分发网格系统中,从而解决热点集问题。另外,该算法只依据局部信息,即可选择待迁移的副本集,以及副本迁移的目的节点集。