大规模云计算集群监控系统设计与实现

被引量 : 15次 | 上传用户:moyixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模集群监控系统用来监测与分析集群系统操作系统运行状态及其他一些重要的节点与集群信息(物理机集群与虚拟机集群),并通过对监测数据持久化后的数据分析来进行监控结果的呈现[1]大规模集群监控系统对集群管理与集群运行状态测量都至关重要,其监测数据可以用于集群运行错误预测及对错误的预处理来帮助管理员来有效的管理大规模集群监控系统不仅可以用于大规模集群的实时(非实时)监控,也可以用于集群资源的远程控制,所以集群管理可以使用监控系统的可视化界面对集群进行远程管理与维护随着当前移动互联网技术与智能手机技术的发展,支持手机监控与报警的监控系统能够帮助管理员与用户随时随地了解集群的运行状态与错误信息,当集群出现问题时,监控系统也能第一时间通知管理员进行错误处理传统的监控系统,大多都采用静态物理机监控方式,监控项目有限,节点守护进行对操作系统的支持有限或依赖于第三方中间件,如ganglia, SuperMon以及InteMon等另外,传统的监控系统对监控数据没有进行更深层次的挖掘或进行有限的挖掘,因为对集群的错误预测与预防支持度不够,如InteMon等最后,传统的监控系统在数据持久化方面,采用文件存储或关系型数据库存储的方式,这样对于若关系型的非结构化监控数据处理能力不强运用数据挖掘技术与开放式轻量级守护进程开发技术,并结合RPC(远程方法调用)与非关系型数据库,本论文对如何进行高效率的大规模集群动态监控做了深入的研究本文主要从以下方面阐述了大规模集群监控系统的设计与实现:1.开放式集群节点守护进程研究针对传统的封闭式节点守护进程或依赖于第三方插件的节点守护进程,并结合目前已经存在的各种守护进程的相关优点,设计出开放环境的节点守护进程,满足用户多层次,多环境的需求2.大规模集群健康诊断模型研究使用数据挖掘技术,对持久化后的数据进行MapReduce分析与挖掘,从而对整个集群的运行状况进行预测与分析,并提供给管理员可度量的评价3.大规模集群监控系统的设计和实现针对以上两点,本论文设计了一个大规模集群监控系统,该系统实现了集群中物理机与虚拟机的实时监控,并实现了报警与集群健康诊断等功能系统性能测试表明,该系统能够高效的对大规模集群节点进行实时监控,并能够对集群运行情况进行实时监测
其他文献
罗泌《路史》是一部保存有大量神话传说内容的著作,它以其全面丰富的资料涵盖和数量巨大的佚文保存,为广大学者所重视。然而,这样一部难得的著作,却没有学者进行深入细致的整理研
怀着对20世纪各种灾难性问题的深刻体认,以赛亚·柏林开始对作为西方政治制度基础的自由主义理论进行深刻地反思。他认为这是主流的一元论意识形态的大行其道所导致的结果,因
随着美国“安然”、“世通”公司会计造假丑闻的曝光,以及紧接而来的我国“中航油”、三鹿“毒奶粉”、双汇“瘦肉精”等事件都暴露出上市公司关键人物凌驾于内部控制之上,内部
自从进入21世纪,随着我国社会经济的迅速发展、人民的物质文化生活水平的提高,我国的贫富差距也在不断地扩大,社会矛盾不断凸显并日益尖锐。慈善组织作为一个缓和社会矛盾、推动
<正>邱明义,湖北中医药大学教授,主任医师,博士生导师。兼任湖北省中医药学会理事,湖北省仲景专业委员会副主任委员,享受国务院津贴。邱教授医术高明,医德高尚,多年致力于伤
随着新课改的程度的推广,近几年,教育界一直致力于研究如何提高教学效率,寻找各种可以使得课堂能够实现优化的途径。真正提高教学效率,应该优化课堂中的每一个环节,导课作为课堂教
近年来,大学生违法犯罪现象日益增多,给家庭、学校和社会带来了巨大影响和严重危害。从犯罪心理学的角度来看,违法犯罪大学生的犯罪心理主要表现为虚荣心理、侥幸心理、嫉妒
随着大量风电并入电网中,为了合理制定发电计划,保证电力系统稳定运行,需要对风电输出功率进行预测。首先根据建模的方法和预测模型的对象两个分类标准,归纳总结了目前风电功
为充分开发利用野生苹果资源,对云南5种野生苹果属植物垂丝海棠、三叶海棠、山定子、湖北海棠和丽江山定子的果实种子形态特征进行了观测研究。结果表明:5种果实形态都为近圆