论文部分内容阅读
本文基于云南省教育厅科学基金《基于集群的网络计算模型与并行编程环境研究》研究项目,选择了“构建全面的资源管理来改善集群负载平衡”的技术路线,综合考虑了集群负载平衡中的各主要因素,为通用的集群系统设计了ILBS(IntelligenceLoadBalancingSystem)。首先,从集群的定义开始,分析了集群系统的特点,在高性能计算方面的优势,并以一个典型的集群系统为例,讨论了集群的硬件资源和软件资源的发展现状和主要技术。第二,全面介绍了集群系统中的负载共享、容错、问题划分、调度技术、负载平衡、并行编程环境、作业管理、集群系统管理等方面的主要技术、工具和研究现状。第三,基于硬件资源和软件的获取、评价、存储、反馈和再利用的思路,设计了一套提高节点利用率的整体方案ILBS。ILBS的总体结构共分成五个功能模块,它们是:资源收集器、系统资源性能评价器、模型管理器、判定库、集群评价模型管理器。通过这五个功能模块共同完成集群资源的获取、评价、存储、反馈和再利用,提高集群的可用性。最后,全面回顾了论文的主要工作,ILBS优点和发展前景;同时也指出ILBS系统中有两个待完善的地方,一是资源获取模块中,当前只考虑了节点为单机的情况,二是用户提交的问题从多个维度进行分类、以及各环节算法的评价等方面的技术与当前的几个主流学科发展息息相关,集群在这些方面的进步离不开与它相关的学科的发展。