论文部分内容阅读
高分子模拟计算网格(MSCGrid)是上海高校“E-研究院”——上海高校网格的一个重要组成部分,它是基于OGSI规范和网格核心中间件的网格计算环境,主要为化学与材料等基础学科的研究提供高分子模拟与分析的计算服务。它是高分子模拟研究中模拟软件、计算资源以及计算结果的共享平台。通过该平台,科研人员可以协同进行大规模的计算型分子模拟并能方便的共享模拟数据及成果。
本文介绍并分析了网格计算技术及网格环境里资源管理的理论和实现技术,围绕高分子模拟计算网格资源管理系统的构建,给出了资源管理平台的功能逻辑结构以及所实现的模块结构,并结合高分子模拟计算任务的需求和特点,着重介绍了MSCGrid网格平台资源管理工作对计算任务容错以及抢先机制的设计和实现。本文的主要内容可以概括为如下几个方面:
1.高分子模拟计算网格资源管理系统的整体设计。主要包括资源管理系统逻辑结构的设计、与其它模块间的关系及接口的制定、所采用技术和工具的选取等;
2.资源管理平台与计算资源结点(计算集群)的整合。接入MSCGrid的几个高性能计算集群的管理系统大多为OpenPBS,它对网格技术的支持有限。本文的资源管理系统同时提供了对OpenPBS与上层资源管理服务的支持,成功的实现了资源管理与计算资源的整合;
3.MSCGrid平台上计算任务的检查点文件的管理以及平台容错服务的实现等。MSCGrid平台上的大多数计算任务有定期保存检查点文件的特性,这为计算任务的容错提供了便利条件。本文解决了分布式系统中常见的“多米诺”效应,保证了计算任务检查点数据的一致性,实现了MSCGrid资源管理系统的容错功能;
4.MSCGrid上任务抢先功能的设计和实现。根据“高分子模拟计算网格”的需求,资源管理系统必须提供对任务抢先功能的支持。我们利用计算任务的检查点功能,实现了对任务抢先机制的支持。
该资源管理系统的实现遵从了OGSA标准和规范,采用XML、SOAP等技术以及Notification机制来降低系统的耦合度,完成了项目的预定目标。“高分子模拟计算网格”原型系统于2004年11月在第六届“上海国际工业博览会”上成功展出,现已经投入试运行。