多集群管理系统中的监控和作业调度问题的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:acecar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了多集群管理系统上的资源监控和作业调度问题。在多集群管理系统的构建上,本文提出了基于层次化思想的分布式树形体系结构,该体系结构具有良好的可扩展性。 利用分布式树形体系结构,本文设计并实现了多集群监控系统LilyGridMonitor,该系统能够监控多集群系统中各集群及集群中的计算节点的静态资源信息和运行时负载状态。该系统,一方面采用注册机制和软状态协议实现了集群的运行时动态加入和删除,解决了计算资源的动态性问题;另一方面,通过资源探测器的插件机制,实现了资源信息种类的动态加入和删除,解决了计算资源种类的多样性问题。 在LilyGridMonitor系统的基础上,本文设计并实现了多集群作业调度模块,该模块采用基于作业需求的K-Subset算法,将作业分配到合适的集群上执行。该模块作为LilyGBS系统的关键模块运行。本文通过实验验证了该模块的效率和实际可用性。
其他文献
视频点播业务以丰富的内容、自主的点播形式等特点受到了广大网络用户的欢迎。已有的视频点播系统还存在着一些缺点,如不支持跨平台、无QoS保证、不支持穿越NAT等等。JMF是SUN
软件过程模型的执行是软件过程建模研究中的重要问题。对象管理组织提出的软件过程工程元模型(Software Process Engineering Metamodel,SPEM)具有良好的过程描述能力且取得了
本论文主要讨论了基于Handle的DNS管理和安全解析的设计与实现。本文作者参与了该系统理论模型的设计以及原型系统的实现,在Handle System系统中集成了DNS模块及Handle DNS协
基于J2EE规范的Web应用服务器作为分布式系统运行时的基础支撑软件,在向客户提供全面的功能性支持的同时,也需要给出优秀的可靠性与兼容性的保障。这就对应用服务器实现的正确
随着天文望远镜及终端设备的设计与制造技术不断提高,天文观测能力大大增强,天文学已从古老的光学观测变为全波段的天文学,并正在进入一个“数据雪崩”时代。计算机与互联网技术
资源管理(Resource Management)是指对计算机中的电子文档资源进行收集、组织、存储、检索,并提供给用户自然高效的交互界面和交互方式。随着计算机技术的飞速发展,用户需要收
事务处理技术是保证信息可靠性和一致性的重要技术。分布事务处理监控器为开发、部署、监控和管理基于三层结构的联机事务处理应用系统构建了一个基础平台,在构筑基于事务处理
在当前数据信息时代,电脑成为人们工作、生活中不可或缺的一部分,一些应用软件如Microsoft Office、Adobe Reader、Chrome浏览器等也占据了举足轻重的地位。随着这些应用软件
随着互联网的发展,网络本身正逐渐转变为一个内容分发的平台,因此信息中心网络学说也逐渐兴起。SOFIA是一种面向服务的信息中心网络体系结构。SOFIA以服务为中心驱动路由,支持服
近年来,因特网获得了飞速地发展。网络规模逐渐扩大,接入的用户越来越多,运行于网络上的应用也趋于多样化,网络攻击由针对单个主机的攻击转向针对整个网络基础设施的攻击,这些都使