虚拟Hadoop集群动态资源调度策略研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:Mike_sun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息和数据爆炸式增长的大数据时代的到来,由分布式计算和网格计算发展起来的云计算,无疑是当今IT领域研究的热点。Hadoop是一个重量级的分布式处理开源框架,它在对大数据存储和处理方面有着明显的优势。这使得它成为越来越多的企业和学者研究的云计算平台。然而海量的数据使得Hadoop集群越来越大,作业类型也越来越繁多,如何使得Hadoop集群处理作业的性能提高,同时又能提高计算资源的利用率,让集群资源得到充分的负载均衡。这已经是当前最受关注的资源调度问题之一。  本论文主要使用当前最主流的开源IaaS云平台OpenStack来虚拟化Hadoop集群,来研究虚拟Hadoop平台动态资源调度策略,进行了如下研究工作:  (1)分析传统企业直接将Hadoop集群部署在物理机上存在的一些资源浪费的问题,和Hadoop集群虚拟化后对资源优化的好处。提出一种将Hadoop节点中的计算节点和存储节点分离,并将其搭建在OpenStack云平台上,使Hadoop集群虚拟化的部署模式。  (2)分析Hadoop的各种应用对计算资源的要求不同,将Hadoop集群处理的作业分为CPU、内存、存储、IO密集型作业。分析Hadoop集群常用的三种作业调度算法,提出从作业类型出发来研究Hadoop集群的虚拟机资源调度算法。  (3)详细研究了OpenStack开源云平台的组织架构,并对OpenStack资源调度机制做出了详细分析研究。分析原有的OpenStack云平台算资源的调度算法,即只根据内存权重来调度虚拟机资源,综合考虑包含CPU、内存、存储、网络带宽等权重参数在内的多种因素,提出一种新的虚拟机资源调度思想。  (4)提出基于改进的蚁群算法和遗传算法的虚拟机调度算法。通过对Hadoop与OpenStack平台的融合,改进OpenStack虚拟机调度算法,从而改善Hadoop集群虚拟机节点的资源调度问题。仿真实验证明,相比于原OpenStack调度算法,改进的蚁群调度算法在任务分配时间、任务执行时间、虚拟机负载率等方面具有明显优势;改进的遗传调度算法迭代次数更加少、负载均衡率更低。从而表明本文提出的这两种算法使Hadoop集群负载更均衡,性能和资源利用率更高。
其他文献
由于复杂网络和许多现实网络有着紧密联系,复杂网络的研究引起了不同学科的广泛重视和关注。最近的研究结果表明网络中的核心节点受到攻击时,具有分形拓扑结构的网络比非分形拓
OFDM是一种可有效地抵抗信道干扰,提高系统的传输速率的吸引人的技术,因此成为当今无线通信的研究热点。OFDM系统将宽的信号带宽分解成在很多个窄带子信道中并行传输。利用此
期刊
随着通信技术的发展,Ad Hoc网络得到了越来越广泛的应用,网络也在朝着大规模的方向发展。近年来,随着地理信息技术不断发展,位置管理策略在Ad Hoc网络研究中越来越引起重视。
运动目标的检测与跟踪是计算机视觉和图像编码研究的主要内容,也是近年来计算机视觉中最具挑战性的研究课题之一,它在机器人导航、智能监视系统、医学图像分析以及视频图像压
期刊
在未来无线通信系统中,自适应资源分配是有效利用有限的频谱资源和提高功率效率的关键技术之一。自适应资源分配的优化问题一般分为两种:速率自适应(RA)和裕度自适应(MA)。本文
GSM(Global System for Mobile Communications,全球移动通信系统),即所谓″全球通″,经过十余年的发展已经成为我国移动通信网的基础。GSM是基于TDMA的数字蜂窝移动通信系统,并
下一代无线通信系统需要有效支持多用户接入和高速数据通信。对抗高速数据通信中的多径干扰和多址干扰是物理层技术研究的重点和关键。以正交频分复用为代表的多载波技术结合
期刊