论文部分内容阅读
摘要:计算机系统具有可以同时进行运算或操作的特性,它包括同时性和并发性,计算机系统的机群系统由一组完整的分布在不同地理位置的计算机系统通过高性能的专业网络或局域网系统互连而成的系统,是并行计算机系统或计算机网络系统的一种类型,它作为一个单独的统一计算机资源来使用,既可以做科学运算,也可供商业运用。
关键词:机群;机群性能;机群类型;机群结构
中图分类号:TP302 文献标识码:A 文章编号:1007-9599 (2013) 02-0000-02
1 机群的定义
计算机系统设计中一个热门的新领域是机群化。机群化作为一种提供高性能和高用性的方法,可能成为对称多处理机SMP的替代物,并对服务器应用特别有吸引力。机群系统的定义是:一组完整的计算机互连,它们作为一个统一的计算机资源一起工作,并能产生机器翻译的印象。术语“完整的计算机”,意指一台计算机离开机君系统仍能运行自己的任务。机群系统中的每台计算机一般称为结点。按此定义,第一点考虑的要素是计算机体系结构的机群集是通过局域网或区域网把一组计算机连接起来,让系统内部的结点相互协调,密切协作,以完成高可用性(一台机子有问题时不影响整体工件),负载均衡(负载合理分摊),高性能大规模计算工作。这些机群系统中的每一个结点均是由负责均衡的完整的计算机相互连接而成。一个工作站,一台个人计算机等都可以组成机群统中的结点,一台大规模相当大的对称多处理机(SMP)也可以计算机系统中的机群。在计算系统中,构建机群的每一个结点上除了有一台或多台处理机外,还有足够的存储设备和一台完整的标准的操作系统,因而机群的结点还可以按常规的交互方式来单独使用。考虑的第二要素是构建计算机体系结构的机群,单独的作为一个整体,统一共享计算机的硬软资源来使用。对于体系结构中的机群,要具有单一系统形象是最主要的。所谓单一系统形象是由计算机用户的视角考虑,用户感觉到使用的是一个单一的系统,整个体系结构机群是一个有机的系统整体,不用考虑网络的结构,也不用考虑网络中结点的位置,结点可以随时调配和使用系统中的资源。至于网络中提供的报务和信息的来源是不必考虑的。各台计算机在计算机体系结构中既可以单独使用,又可以若干计算机相互连接统一协调,故体系结构中的机群可以充分利用机器网络服务的各种资源,达到高可靠性和高并行性的要求,因而不同于局域网。局域网是一个分布式系统,没有单一系统形象,都是各自独立地工作。机群又与MPP不同,MPP的结点上采用的处理机往往比较简单,结点数目可以达到上千个。体系结构在构建时,机群的结点之间采用的是商品化的网络互连,这些结点一般都是个人计算机或工作站。结点数目没有MPP多。MPP并行级在操作系统一级,机群系统并行级在操作系统以上并行。从实际应用的角度考虑,体系结构中的机群主要适用于中小规模并行处理的计算机应用领域。
2 机群系统的性能分析
对于体系结构的机群系统的在性能方面做了分析,要从其特点入手,体系结构中的每一个结点带有自己的存储器和本地磁盘。每个结点配有一套完整的AIX操作系统(IBM的类UNIX操作系统),结点间的互连网络接口是松耦合的,通过结点本身的I/O微通道连接到网络上。结点的硬件和软件都能按不同用户的应用和环境的需要而个别地进行配置。其性能如下:2.1 机群中的结点使用方便。在机群系统的开发中,用户在常用的操作环境下(可以是不同的操作系统和软件开发平台)开发和运行应用程序,这些软件可以不做任何修改,在机群系统上运行。机群系统上对并行应用程序的编程,十分方便,为单处理机执行所开发的应用程序方便使用。2.2 机群系统是高可靠性的。机群系统中的每一个结点都可以有自己的存储体系,而体系中是由多个存储器、处理机和磁盘部件组成的存储体系结构,存储系统十分丰富和完善,并建有相应完善的系统机制,在系统中不会出现“死锁”现象,若某一个结点或部件出现故障,不会影响体系结构,也不会影响整个系统,其他结点或部件正常运行,运行机制十分完善,系统中的每个结点都有自己独立的操作系统,即使某个结点的操作系统出现问题,也不会影响系统中的其它结点,仍正常运行。在体系结构独立的计算机机群系统中,对硬件监控信息的采集采用了通过硬件直接读取被监控硬件信息的方法,对软件信息的监控采用了硬软结合的方法维护系统。2.3 性价比高。计算机机群的中的每个结点和网络互连的资源等,都是商品化开发的过程,都属于计算机产品,供开发商来进行大大批量开发和生产,在此类商品的开发和研制过程中,生产成本降低,功耗小,成本不高,決定了计算机体系结构的机群的性价比高。是不同于其它高端产品。在考虑性能峰值时,相同的情况下,机群的性价比传统的MPP和PVP可以低2个数量级。2.4 结点数量可缩放。计算机机群的数据处理随计算机结点数目的增加而相应的增加。体系结构构建时,构成计算机系统硬件资源的存储体系、磁盘处理体系、处理机,以及输入输出设备都可随机增减。结点与结点之间是高耦合的,结点的数目可以增加到上百个。对于SMP只能增减处理机,数目也只能达几十个,是紧耦合的。机群在构建时,也有不足之处。主要是由于机群是由计算机系统组成的,而计算机系统是由多台完整的计算机构建的,它的维护工作是由计算机系统决定的,其工作量和维护费用比较高,硬件和软件的维护成本较高,相当于维护多个计算机系统以及网络资源。SMP则显得比机群好,维护性能好,成本低,减少了维护工作量和成本。
3 机群的基本类型
机群系统可以按照应用或结构进行分类。按应用目标可分为面向科学计算型或面向关键任务应用型;按组成机群的处理机类型可分为·PC机群和·工作站机群以及·SMP(对称多处理器)机群;按处理机操作系统可分为Linux机群,如Beowulf、Solaris机群,如BerkeleyNOW、NT机群,如HPVM、AIX机群,如IBMSP2、数字VMS(虚拟存储机)机群;按处理机的配置可分为同构型机群(所有结点拥有近似的构造和相同的操作系统)和·非同构型机群(所有结点拥有不同的构造和不同的操作系统。);按处理机的位置和数量可分为组机群,结点数量为2~99,通过SANs(系统级网络),如Myrinet,机群实际上装入一个机箱中或存在一个范围之内、部门机群、企业机群,结点数量为几百;按构筑机群的方式可分为专用机群和非专用机群。
企业机群主要是为发充分利用各个结点的资源空闲而设计的,机群系统中的各结点是松散的,不需要由地理位置决定。一台完整的SMP或个人处理机都可以组成结点,各种外部设备都可以附加到结点上。分散控制各个结点,结构上采用异构型配置,内部通信对外界是暴露的,可以TCP/IP协议接入到通信线路上,通信开销较大。
专用机群是装置比较紧凑,集中放置在一个区域,采用集中控制,替代传统的大中型机或巨型机而设计的。此类系统的机群内部通信是屏蔽的,在系统的前端前置一台计算机机来访问。多个用户用可以通过此类系统来进行交互式或批处理,开发系统应用程序或使用系统资源,其响应时间短,作为一台单一的机器来安装、管理和使用。
4 机群系统的结构
机群系统包括下列组件:高性能的计算结点机(PC、工作站或SMP),具有较强网络功能的微内核操作系统,高效的网络/交换机(如千兆位以太网和Myrinet),网卡(NICs),快速传输协议和服务,中间件层包括某些支持硬件(如数字存储通道、硬件分布共享存储器及SMP技术),系统管理工具和电子表格,运行系统(如软件分布共享存储器和并行文件系统、资源管理和调度软件等),并行程序设计环境与工具(如编译器、语言环境、并行虚拟机(PVM)和消息传递接口(MPI)等),串行和并行应用程序。
机群系统的结构有两种不同的结构,无共享结构和共享磁盘结构。大多数机群都采用无共享的结构。二结点间的互连机制是与其他非机群系统计算机共享的高速信息链路,因而保证了服务器机群与远程客户系统之间的连接。在很多要求高可靠性事务处理中使用小高型高可靠性机群,则往往采用共享磁盘的系统结构。一个结点失效时,别的结点继续工作。这两种机群系统都在结点的I/O总路线间进行互连。
关键词:机群;机群性能;机群类型;机群结构
中图分类号:TP302 文献标识码:A 文章编号:1007-9599 (2013) 02-0000-02
1 机群的定义
计算机系统设计中一个热门的新领域是机群化。机群化作为一种提供高性能和高用性的方法,可能成为对称多处理机SMP的替代物,并对服务器应用特别有吸引力。机群系统的定义是:一组完整的计算机互连,它们作为一个统一的计算机资源一起工作,并能产生机器翻译的印象。术语“完整的计算机”,意指一台计算机离开机君系统仍能运行自己的任务。机群系统中的每台计算机一般称为结点。按此定义,第一点考虑的要素是计算机体系结构的机群集是通过局域网或区域网把一组计算机连接起来,让系统内部的结点相互协调,密切协作,以完成高可用性(一台机子有问题时不影响整体工件),负载均衡(负载合理分摊),高性能大规模计算工作。这些机群系统中的每一个结点均是由负责均衡的完整的计算机相互连接而成。一个工作站,一台个人计算机等都可以组成机群统中的结点,一台大规模相当大的对称多处理机(SMP)也可以计算机系统中的机群。在计算系统中,构建机群的每一个结点上除了有一台或多台处理机外,还有足够的存储设备和一台完整的标准的操作系统,因而机群的结点还可以按常规的交互方式来单独使用。考虑的第二要素是构建计算机体系结构的机群,单独的作为一个整体,统一共享计算机的硬软资源来使用。对于体系结构中的机群,要具有单一系统形象是最主要的。所谓单一系统形象是由计算机用户的视角考虑,用户感觉到使用的是一个单一的系统,整个体系结构机群是一个有机的系统整体,不用考虑网络的结构,也不用考虑网络中结点的位置,结点可以随时调配和使用系统中的资源。至于网络中提供的报务和信息的来源是不必考虑的。各台计算机在计算机体系结构中既可以单独使用,又可以若干计算机相互连接统一协调,故体系结构中的机群可以充分利用机器网络服务的各种资源,达到高可靠性和高并行性的要求,因而不同于局域网。局域网是一个分布式系统,没有单一系统形象,都是各自独立地工作。机群又与MPP不同,MPP的结点上采用的处理机往往比较简单,结点数目可以达到上千个。体系结构在构建时,机群的结点之间采用的是商品化的网络互连,这些结点一般都是个人计算机或工作站。结点数目没有MPP多。MPP并行级在操作系统一级,机群系统并行级在操作系统以上并行。从实际应用的角度考虑,体系结构中的机群主要适用于中小规模并行处理的计算机应用领域。
2 机群系统的性能分析
对于体系结构的机群系统的在性能方面做了分析,要从其特点入手,体系结构中的每一个结点带有自己的存储器和本地磁盘。每个结点配有一套完整的AIX操作系统(IBM的类UNIX操作系统),结点间的互连网络接口是松耦合的,通过结点本身的I/O微通道连接到网络上。结点的硬件和软件都能按不同用户的应用和环境的需要而个别地进行配置。其性能如下:2.1 机群中的结点使用方便。在机群系统的开发中,用户在常用的操作环境下(可以是不同的操作系统和软件开发平台)开发和运行应用程序,这些软件可以不做任何修改,在机群系统上运行。机群系统上对并行应用程序的编程,十分方便,为单处理机执行所开发的应用程序方便使用。2.2 机群系统是高可靠性的。机群系统中的每一个结点都可以有自己的存储体系,而体系中是由多个存储器、处理机和磁盘部件组成的存储体系结构,存储系统十分丰富和完善,并建有相应完善的系统机制,在系统中不会出现“死锁”现象,若某一个结点或部件出现故障,不会影响体系结构,也不会影响整个系统,其他结点或部件正常运行,运行机制十分完善,系统中的每个结点都有自己独立的操作系统,即使某个结点的操作系统出现问题,也不会影响系统中的其它结点,仍正常运行。在体系结构独立的计算机机群系统中,对硬件监控信息的采集采用了通过硬件直接读取被监控硬件信息的方法,对软件信息的监控采用了硬软结合的方法维护系统。2.3 性价比高。计算机机群的中的每个结点和网络互连的资源等,都是商品化开发的过程,都属于计算机产品,供开发商来进行大大批量开发和生产,在此类商品的开发和研制过程中,生产成本降低,功耗小,成本不高,決定了计算机体系结构的机群的性价比高。是不同于其它高端产品。在考虑性能峰值时,相同的情况下,机群的性价比传统的MPP和PVP可以低2个数量级。2.4 结点数量可缩放。计算机机群的数据处理随计算机结点数目的增加而相应的增加。体系结构构建时,构成计算机系统硬件资源的存储体系、磁盘处理体系、处理机,以及输入输出设备都可随机增减。结点与结点之间是高耦合的,结点的数目可以增加到上百个。对于SMP只能增减处理机,数目也只能达几十个,是紧耦合的。机群在构建时,也有不足之处。主要是由于机群是由计算机系统组成的,而计算机系统是由多台完整的计算机构建的,它的维护工作是由计算机系统决定的,其工作量和维护费用比较高,硬件和软件的维护成本较高,相当于维护多个计算机系统以及网络资源。SMP则显得比机群好,维护性能好,成本低,减少了维护工作量和成本。
3 机群的基本类型
机群系统可以按照应用或结构进行分类。按应用目标可分为面向科学计算型或面向关键任务应用型;按组成机群的处理机类型可分为·PC机群和·工作站机群以及·SMP(对称多处理器)机群;按处理机操作系统可分为Linux机群,如Beowulf、Solaris机群,如BerkeleyNOW、NT机群,如HPVM、AIX机群,如IBMSP2、数字VMS(虚拟存储机)机群;按处理机的配置可分为同构型机群(所有结点拥有近似的构造和相同的操作系统)和·非同构型机群(所有结点拥有不同的构造和不同的操作系统。);按处理机的位置和数量可分为组机群,结点数量为2~99,通过SANs(系统级网络),如Myrinet,机群实际上装入一个机箱中或存在一个范围之内、部门机群、企业机群,结点数量为几百;按构筑机群的方式可分为专用机群和非专用机群。
企业机群主要是为发充分利用各个结点的资源空闲而设计的,机群系统中的各结点是松散的,不需要由地理位置决定。一台完整的SMP或个人处理机都可以组成结点,各种外部设备都可以附加到结点上。分散控制各个结点,结构上采用异构型配置,内部通信对外界是暴露的,可以TCP/IP协议接入到通信线路上,通信开销较大。
专用机群是装置比较紧凑,集中放置在一个区域,采用集中控制,替代传统的大中型机或巨型机而设计的。此类系统的机群内部通信是屏蔽的,在系统的前端前置一台计算机机来访问。多个用户用可以通过此类系统来进行交互式或批处理,开发系统应用程序或使用系统资源,其响应时间短,作为一台单一的机器来安装、管理和使用。
4 机群系统的结构
机群系统包括下列组件:高性能的计算结点机(PC、工作站或SMP),具有较强网络功能的微内核操作系统,高效的网络/交换机(如千兆位以太网和Myrinet),网卡(NICs),快速传输协议和服务,中间件层包括某些支持硬件(如数字存储通道、硬件分布共享存储器及SMP技术),系统管理工具和电子表格,运行系统(如软件分布共享存储器和并行文件系统、资源管理和调度软件等),并行程序设计环境与工具(如编译器、语言环境、并行虚拟机(PVM)和消息传递接口(MPI)等),串行和并行应用程序。
机群系统的结构有两种不同的结构,无共享结构和共享磁盘结构。大多数机群都采用无共享的结构。二结点间的互连机制是与其他非机群系统计算机共享的高速信息链路,因而保证了服务器机群与远程客户系统之间的连接。在很多要求高可靠性事务处理中使用小高型高可靠性机群,则往往采用共享磁盘的系统结构。一个结点失效时,别的结点继续工作。这两种机群系统都在结点的I/O总路线间进行互连。