论文部分内容阅读
随着互联网与计算机技术的飞速发展,针对爆炸式增长的网络数据,集群技术得到了广泛的应用。随着集群的搭建成功以及节点的不断扩充,集群自身的可靠性和稳定性已成为不可忽视的重要因素,因此各类监控系统应运而生。对中小企业而言,既难以承受商业监控软件高昂的费用,也很少有自主开发监控软件的能力,因此需要针对中小企业,提供一套完善的集群监控服务机制。同时在目前已有的监控系统中,大多采用“事后报警”的方式,从集群管理人员的角度来看,能够在系统发生故障之前进行预警,有利于避免重大事故的发生,因此在监控系统中加入短期实时预测算法,并能根据预测结果进行预警显得尤为重要。本文首先对目前已有的监控系统进行充分了解,比较分析后,基于开源监控软件Zabbix实现面向中小企业的实时监控预测平台。该监控预测平台对集群中各类指标进行实时监控,对重要性能指标进行实时预测,当监控或预测到异常情况时,对监控人员进行告警或预警,有利于管理人员实时掌握集群运行情况。本文主要工作包括以下几个方面:针对中小型企业,基于Zabbix设计一套集群监控方案,实时采集集群性能数据,掌握运行情况;研究分析集群性能指标的数据特性,基于时间序列预测方法,设计预测模型,并根据该预测模型设计并实现了一种短期实时预测算法;分析并修改Zabbix的开源代码,将预测算法加入该监控预测平台中,实现监控指标在线短期预测的功能;在对集群监控的基础上,通过脚本实现故障的自动报警与预警;通过对数据库进行表分区以及创建自动维护分区存储过程来提高数据库的性能。本文在实现集群监控预测平台后,对系统进行了充分的功能性测试,发现该监控预测平台具有足够的正确性,能全面监控集群性能指标,且在发生或预测到异常信息时,能有效进行告警或预警。同时在实现短期实时预测算法后,通过比较分析监控指标的实际值与预测值,验证了该预测算法的有效性,能够达到“事前报警”的目的。结果证明,该集群监控预测平台能够保障集群稳定健壮地运行。本文完成了预期工作。