基于Torque的异构集群平台调度算法的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高性能计算产业的蓬勃发展,越来越多的研究机构和商业公司向这一领域投入大量的人力和物力资源。而集群作为高性能计算的一种重要方式,以其高可扩展性和高性价比等优势在高性能计算中占据越来越重要的地位。随着GPU通用计算的发展,GPU异构集群正渐渐成为集群的主流架构。Torque是一种非常常见的开源集群管理系统,广泛应用于高校和其他研究机构的集群环境中。Torque在资源管理方面很强大,支持超过1500个计算节点,几乎支持全部的UNIX/Linux系操作系统并且在不断更新。但是在作业调度方面,Torque比较薄弱,其调度算法过于简单,同时也无法支持GPU作业的调度。本文设计并实现了一种面向异构集群的、基于自学习的动态负载均衡调度算法,对Torque的调度功能进行了扩展。然后设计实现了图像卷积算法和X.264视频编码这两个GPU应用实例,对扩展后的Torque系统进行了测试,发现其能很好地支持GPU作业并且在性能上得到了很大的提升。
其他文献
在迅速发展的网络经济模式下,符合OGSI规范的网格服务作为Web服务的扩展,在提供良好的互操作性的同时,改善了传统分布式集成系统的性能,并使得软件部件的商业化更加容易。在
近年来,各种针对信息系统的攻击越来越普遍,并且变得更加难以防范。其攻击方式从传统的本地病毒攻击逐渐演变成分布式、高速传播的网络攻击行为。现有的入侵检测技术由于本身的
随着时间的推移和主题的变化,数据仓库系统中大量的细节级数据成为过期的数据,但是这些数据并不是无用的数据。为了保证当前的联机分析处理(OLAP)和数据挖掘(DM)应用程序的效
企业信息系统在现代企业中的作用越来越重要,但是随着Internet的迅速发展,企业信息系统面临了许多新的挑战。业务规则、业务流程的不断变化使得开发者不断的修改代码来满足客户
在通信市场日新月异的今天,移动通信公司作为短信平台提供商,为了增加市场竞争力,结合其营业系统向各应用/内容提供商(简称SP)有尝提供通信通道以向用户提供各类短信应用服务
本文先针对虚拟内窥镜的CT数据采集的方式介绍了医学图像DICOM数据格式及其读取方法,进而对虚拟内窥镜中运用效果较好的四种分割方法(区域增长法、分水岭法、水平集法和快速
随着计算机科学技术的飞速发展,计算机技术应用在了越来越多的领域,实现各种功能的软件被大量的开发出来,应用在我们的生活、学习、工作当中。相应地,也产生了许多用以编写计
目前,市场上有众多的支持多机上网的路由器,能实现基于IPv4的主机访问Internet;也有各种IP电话终端设备,能实现IP语音通信。这些路由器和IP电话设备功能单一,往往不具备支持基于IP
随着网络的飞速发展,Java 得到了广泛的应用并成为服务器端开发平台的一种主要技术,出现了企业性质的基础构造——J2EE,允许 Java 开发人员创建复杂和强有力的企业应用服务程
作为原油生产的油管,在油田的使用量非常大,油管螺纹连接质量直接影响油田的正常生产。目前,对油管螺纹质量的检测大部分还停留在人工的基础上,检测误差大,而且效率低。如何采用一