基于Ganglia的Hadoop集群监控系统研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:dsgver5r33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算的快速发展,分布式集群系统也被广泛应用,发展云计算技术已经成为我国重要的经济和科技发展战略之一,研究和发展云计算技术并将原有信息化数据向云计算平台迁移,是未来十年政府信息化建设的主流方向。Hadoop作为高效的数据分析与数据挖掘的软件,已经成为云计算平台不可或缺的一部分。云计算提供的服务越来越多,需要处理的数据量和种类不断增加,同时对于数据处理结果的快速性和准确性要求越来越高增加,所以对云计算平台的监控就显得非常必要。数据量的增加导致Hadoop自带的监控系统已经无法满足对资源的有效监控,现有的监控软件只能分别的监控不同平台、不同系统的各种应用以及服务,无法对云平台的所有资源进行全面监控。为解决这个问题,本文利用Ganglia监控软件,设计并开发实现Hadoop集群监控系统,主要研究工作如下:1)利用Ganglia实现对Hadoop集群系统的监控。通过对每个节点之上部署Gmond客户端收集节点监控数据,Gmetad汇总收集信息传递到RRDTool中,最终利用RRDTool的绘图功能把监控信息以图表形式通过Web界面展现给管理人员。2)利用Nagios实现警告服务。通过对Nagios中监控时段、监控联系人、主机与主机组、服务与服务组等配置文件的修改,使集群监控系统能够实现通过界面、邮件或者短信的方式,即使管理者不在监控系统之前,也能够收到警告信息。3)实现数据的持久化存储。RRDTool数据库是一个环形数据库,存储容量有限,利用HBase的Java API接口把RRDTool数据库中的数据转移到HBase之中,从而实现数据的持久化存储。4)对集群的监控效果进行验证。在监控系统部署实施完成之后,对需求分析中所要达到的监控效果,如数据块的监控、节点任务的监控、邮件警报服务和短信警报服务进行验证,对显示丢包率和三种警报方式的反应时间做了具体的数据测试,确认所设计的监控系统满足系统监控需求。
其他文献
背景和目的:MicroRNA(miRNA)是一类大小约22nt的非编码RNAs,通过抑制靶mRNA的翻译或降解靶mRNA在转录后水平调节靶标基因的表达,从而参与细胞增殖、分化、凋亡等过程。有研究
目标跟踪是计算机视觉领域的一块重点内容。随着其它支撑类学科的发展,目标跟踪算法也在不断进步当中。传统的目标跟踪算法往往是通过对目标运动趋势的估计来实现对非快速运
近几年来,数据处理技术飞速地发展,一些基于数据分析的应用技术也随之大量涌现。并且伴随着各领域中信息采集技术的不断更新,出现了大量实时的非结构化数据,这些实时产生的数
并行组合扩频通信是一种新型高效的扩频通信方式,同时继承了直接序列扩频通信抗干扰、低截获、强多址通信能力等优势,具有广泛的应用前景。由于并行组合扩频通信系统发送的是
随着Web2.0时代的到来,在线知识社区(Online Knowledge Community,OKC)作为用户进行知识交换的一个大规模协作平台,一方面以其自组织形式促进着客观知识体系的构建,另一方面
目的:为了解人胃癌组织中ESRP1及E-cadherin的表达情况,并分析其表达与胃癌临床病理特征以及预后的关系,进一步探索ESRP1及E-cadherin在胃癌发生发展过程中所起的作用及可能
地掷球运动对于中国来讲是一项古老而又年轻的新兴体育项目,自1984年引入以来,虽然是非奥运项目,但历经三十余年的发展,在广大体育工作者的努力下,地掷球运动不但没有逐步消
机器人是一种高端智能的机电设备,该领域的发展水平是衡量一个国家综合制造能力的重要指标。水下机器人的视景仿真关键技术的研究也是该领域的一个重要研究方向。本课题是以
为了获得逼真的3D音频效果,可以通过增加声道数量实现多声道数字音频系统。但是,声道数的增加伴随着音频数据量的增加,在存储容量有限,传输带宽受限的情况下,必然会降低对3D
Z=28-40核区的核吸引了很多实验和理论家的注意。实验发现这一核区的Sr、Y和Zr核的低激发态能级可以被球形壳模型很好的解释,但是在轻质量的Br和Kr核却发现集体性很强,当N,Z