论文部分内容阅读
随着现代科学技术水平的不断发展,传统的科研手段已经不能适应当前的科研需求。而e-Science概念的出现,使得跨学科、跨地域和跨文化的科学家群体可以共同协作完成大型科学研究工作。网格技术被认为是未来信息社会的基础设施之一,它提供了不同地理位置之间、大规模资源跨组织协调共享的能力,目前逐渐成为e-Science应用中的基础底层架构。在网格环境下,各种软件、硬件等资源都以网格服务的形式存在,然而大规模的科学应用往往表现为复杂的科学流程,单个网格服务由于其功能单一而无法完成一个计算量巨大且计算步骤繁杂的科学任务。网格工作流能够方便地构建、执行、管理和监控网格应用,使得网格应用能够自动、高效地实施,然而网格资源的多样性、动态性、异构性、分布性使得对大规模科学流程的处理受到一定的限制,而传统工作流的方法和技术不能有效地处理网格环境中的有关问题。因此,需要针对网格和网格科学应用自身的特点重新研究面向复杂网格科学计算应用的网格工作流处理技术,为科学家在e-Science环境中开展复杂科学计算、实验分析、协同工作以及成果共享等研究活动提供一种便利的研究方式。为解决上述问题,我们提出了抽象网格服务和用户作业需求描述两个核心概念,设计和实现了面向e-Science应用网格工作流管理系统。通过把相同功能类型的网格服务抽象成抽象服务,从而屏蔽了网格平台服务的异构性进而实现对网格服务的动态调用。该系统首先提供了一个工作流可视化编辑界面,方便科学家通过对抽象服务使用拖拽方式来编排网格工作流,同时也提供了用户作业需求描述文档来定制工作流中单独的科学任务单元对网格平台的执行环境、网格服务以及任务本身的特殊化需求;并提供了面向应用工作流管理系统对抽象工作流进行分解,并生成单独的作业,同时组合作业需求描述以及相应的数据信息,形成具体的任务作业,最后分发到作业池中。在此系统中作业池主要负责作业的接收、分发和缓冲,并根据网格资源的负载情况把作业分发到网格作业管理系统。因此,通过此系统能够创建更加灵活的面向科学协作的大规模协同工作环境,更好地使用网格资源,从而提高工作效率。