论文部分内容阅读
随着科学技术的快速发展,很多科学计算和复杂应用系统需要的计算量越来越大,如高能物理、生物信息学、化学分子模拟以及数值天气预报等等。现有的单个计算机,即使是大型计算机也很难满足人们日益增长的对计算能力的需求。同时,随着计算精密度的日益提高,其产生的数据量也在不断增长,达到了几十Terabyte甚至PetaByte的级别。这就需要一种环境使得它既能满足用户对计算能力的需求,又能让用户来随时存取所需的数据,使其能够方便的建立、存取、传输和复制各种数据文件。因此,网格技术应运而生。 网格是一种计算基础设施,它将地理上分布、异构的多种计算资源通过高速网络连接起来,共同完成计算问题。它为用户解决超大规模、超级复杂的计算密集或者数据密集的问题提供了途径。实现网格计算的一个重要目的在于实现地理分布的、异构的资源的统一描述方法,将用户使用的各种计算程序封装成服务并对其提交的作业进行监控管理,对用户使用过程中产生的数据进行存储和管理,并且建立一个统一的网格门户,使用户能通过一个熟悉的用户界面、一致的操作方式和高效方便的访问机制来使用网格服务和获取网格服务,从而解决网格系统资源使用复杂的问题。 本文以大规模科学和工程计算为背景,以网格为基础环境,对网格中的作业管理、数据存储和管理以及网格门户的设计进行了研究。在对网格研究的基础上,给出了面向科学与工程计算的网格应用平台的设计原则及其四层体系结构,分别介绍了各层的组成和功能,然后着重阐述了网格应用平台设计当中的几项关键技术,包括:网格环境中的作业描述,作业提交、执行、调度,网格环境中的存储系统和数据管理以及网格门户Portal的设计,并结合已经初步在山东省高性能计算中心网络环境中搭建部署的山东省科学与工程计算网格平台介绍了具体的实现,并给出了部分操作的使用流程。