论文部分内容阅读
中国移动广东公司省级综合网管系统经过多年建设,系统功能建设日益丰富,支撑生产的能力逐步扩大,已经成为日常运维不可或缺的生产支撑系统,随着综合网管系统价值的不断显现与稳步提升,以及IT系统安全管理、风险内部控制等重大管理举措的实施,省/市公司对综合网管系统如何保障数据质量提出了更高要求和期望。为更好地及时分析、查找、评估和解决综合网管系统各应用场景的数据质量问题,保证数据质量的稳定可靠,需要构建一系列综合网管系统数据提升的手段,为数据质量管理工作提供强有力的系统支撑。系统基于可扩展性,安全性,可操作性,可靠性,可维护性为原则。该系统通过参数驱动、模块化设计等方法,提供强大的灵活性和可扩展性,随着业务和管理的发展,本系统能以快速灵活的配置方式,将其管理范围逐步扩充;充分考虑整个系统运行的安全策略和机制,可以根据不同的业务要求和应用处理,设置不同的安全措施;用户界面采用中文界面,提示信息通俗易懂,对于常用操作会设置“快捷键”,以方便功能间的快速切换;充分考虑硬件和软件的容错、数据存储的备份/恢复等系统可靠性措施;按照可维护性原则进行设计,对重大操作可进行日志记录,且在需要时可提供程序的每一步处理可追踪功能。总体来说,主要有以下工作内容:1)研究了对主机系统进行信息采集的常用方法。采用开源的gmond作为监控的Agent,监控的数据能做到秒级实时监控;2)设计了代理端与服务器端的通信协议,使用XML对数据进行描述,使系统具有良好的扩展性;3)研究了系统服务架构的选型。主要集中在REST、WebSocket中做选择。考虑到系统业务比较轻量级,字典数据、静态资源、监控数据查询、告警查询等比较倾向于传统的HTTP请求/响应模式,即无状态的通信方式,而WebSocket的双工通信、服务推送优势发挥不出来,REST更贴近、更合适此系统,所以选择REST;4)研究了主机性能数据的主要特性,从系统列表的数据结构,范围查询,灵活性,可拓展性,分布式读写操作等特性方面考虑,最终采用Cassandra作为整个系统的内存数据库;5)设计和实现的了整个系统的web管理页面,以颜色,列表,表盘,曲线等多种手段显示主机的运行状况。