论文部分内容阅读
云计算作为一种新兴的的网络计算模式,为用户提供了海量计算能力、大规模数据处理、大容量存储等功能,已经成为了一种被业界普遍接受的计算模式,吸引了各方包括学术界、政府界和产业界的广泛关注,被认为是未来计算机发展的趋势,将极大的改变人类的生活方式。云计算具有高度伸缩性、高可靠性以及资源的最大化利用等特点。云平台作为大规模计算机集群,如何保障云平台的稳定可靠运行,简化部署流程,提高管理效率,提升云平台的可靠性和安全性成为现阶段云计算研究方向的一个热点问题。云平台监控系统是云平台的重要组成部分,在保障云平台的稳定性和服务质量方面有着举足轻重的作用,因此对监控系统的研究是很有意义的。本文对云计算和云平台监控相关概念和技术进行研究,分析了设计云平台监控系统所面临的关键问题,设计并实现了云平台监控系统Nervous。Nervous是基于仿生自主神经系统(BANS)原理,借鉴开源项目Ganglia的结构,而设计开发的一款针对云平台资源的监控系统。该系统对云平台内部各种资源的性能指标、安全性进行实时监控并记录历史其信息,及时发现资源故障,对于非重大的故障能实现自我修复,对于需要管理员参与排除的故障能及时通知云平台管理员,并提供历史信息供其快速定位排查。在WEB管理界面,通过曲线很容易见到每个节点的工作状态和历史信息,方便云平台管理员第一时间了解云平台状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。首先,本文对涉及到的相关技术进行了研究,包括云计算、集群监控、BANS仿生自主神经系统、Ganglia开源集群监视项目、Round Robin数据存储技术等,然后针对设计监控系统中所面临的关键问题,给出了分析而且比较了各种方案,接着阐述了Nervous云平台监控系统的整体结构和详细设计,同时给出了各个部分的具体实现,最后本文将Nervous监控系统部署在实验室的云计算平台上进行了功能测试,同时给出了测试结果分析。Nervous云平台监控系统弥补了ganglia开源监控项目不能下达指令到被监控对象执行和缺乏告警机制的短板,同时融入了仿生自主神经系统BANS的思想。