论文部分内容阅读
俗话说,三分建设,七分运维。近年来云计算、大数据、BYOD风光无限,但若缺失了行之有效的运维保障,这些新技术在企业组织中的应用推进步伐就会乏力。例如:机房中核心设备因新应用出现哪怕微小故障,通过“多米诺效应”的传递力,最终都可能导致业务的中断。随着IT与业务融合进程的逐步深入,IT运维管理在现代企业发展过程中担负起的责任越来越重要。
规模大、应用多
覆盖80个中央政务部门和相关单位,管理31个省、自治区、直辖市和新疆生产建设兵团,并能够让20多个中央政务部门的全国业务系统在这张“大网”上稳定运行。这样一张规模大、覆盖面广的复杂网络,其运维管理人员还不到20人,究竟是如何做到的呢?
“国家电子政务网”是在工业和信息化部电子科学技术委员会及工业和信息化部基础产品发展研究中心指导下,建立的全国最早的、系统全面的介绍电子政务建设、信息化建设的专业网站。由基于国家电子政务传输网的政务内网和政务外网组成。其中,国家电子政务网络政务内网由党委、人大、政府、政协、法院、检察院的业务网络互联互通形成,主要满足各级政务部门内部办公、管理、协调、监督和决策的需要,同时满足副省级以上政务部门的特殊办公需要;政务外网主要满足各级政务部门社会管理、公共服务等面向社会服务的需要。
政务外网由国家信息中心负责承建,该网目前已连接中央政务部门80个,连接31个省、自治区、直辖市和新疆生产建设兵团,成为我国覆盖面最广,连接部门最多,规模最大的政务公用网络。
目前,电子政务外网已经承载了中纪委监察部、国务院应急办、国务院扶贫办、国家审计署、国家安监总局等20多个中央政务部门的全国性业务应用。国家发展改革委、人力资源和社会保障部、中编办等十多个中央政务部门使用政务外网互联网出口,实现了政务公开和公共服务业务。环保部、卫生部业务应用的部署也正在逐步展开,人社部金保二期工程、公安部人口库等项目也已有意向依托政务外网运行。另据不完全统计,各地基于政务外网部署的行政审批、电子监察、应急平台、社会保障、文化共享等业务应用系统总计已达1200多项。为各地提高为民服务水平,提升行政效率,节约财政经费起到了积极作用。
随着电子政务外网规模逐渐增大、接入的政务部门逐渐增多,电子政务外网业务所面临的运维管理问题日益凸显。
对接整合是难点
国家电子政务外网管理中心外网办运行管理处副处长吴阿明介绍说,电子政务外网是一个比较复杂的网络,它不像部委网络采取的多级架构,而是由省级和中央级网络两大管理核心组成。其中省网是早已建好的独立网络,所以两大管理核心的对接整合成为难点。
从结构上来讲,各大部委都有自己的结构路由器,各省有落地路由器。这些设备、线路、链接都由管理中心进行管理。以管理中心的运维平台为总平台,将省级和其他网管系统纳入体系,实现相互之间的协同和数据共享,以保证端到端的业务交互。
从应用上来说,吴阿明认为电子政务外网主要有四大需求,定位需求、管理人需求、决策人需求以及用户需求。“你可以理解为类似运营商的网络,既面向工信部用户,也要面向省里和其他用户,因此要求运维体系要能够监控所有网络,出现问题及时解决。除此之外还有流程、资源管理、服务管理等需求,并在此基础上进行整合。”他说。“由于不仅涉及到同种系统对接,还涉及到异构系统对接,这是一个不小的挑战。”
因此,在整合方面有很多技术问题是管理中心难以独立解决的,他们希望找到一个战略合作伙伴来一起进行。除了技术上的支持外,管理中心更需要方法上的建议以及战略合作伙伴按照他们的需求进行持续改进的能力。2012年5月,管理中心选择了锐捷网络RIIL IT综合业务管理平台作为总控制台来管理政务外网。迄今为止,他们已经基于该平台完成了不少改进,与异构网络的对接管理工作也不再成为问题。
满足可视化需求
网络运维管理,监控很重要。“首先要快速发现并定位故障;其次要掌握整个网络运行情况并进行分析;最后要将运行情况呈现给上级管理部门,并将业务运行情况反馈给用户。此外,管理中心和省网之间要进行协同,保障部委多级纵向业务在网络上的运行,还要注意在运维中加强和省网之间的协调。”吴阿明说。
除此之外,对于复杂的网络管理还有一个重要要素是可视化。
传统的机房监控只能看到温湿度、是否漏水、烟感UPS等内容,而要实现故障快速准确定位,要求信息量更精确,内容能够可视化,通过拓扑图中的信息很难直接表达呈现。在RILL运维平台上双击数据区之后,可以看到数据区的机房结构,还可以用3D方式通过各个视角来察看资源情况。可以具体查看机柜中的各种设备,包括显示、运行状态以及其他基础信息。这些都可以根据运维属性以及配制属性进行定制。发生故障时,值班人员可以看到具体是哪一个机柜的哪些设备出了问题。
故障定位后,系统会自动发送告警信息。告警方式有短信、邮件等类型,但由于电子政务外网是涉密网站,目前告警方式主要通过邮件来进行。而告警条件的设置,则要根据业务情况进行选择。可以设定规则形成模板,之后应用到各个资源之上。在项目实施的初级阶段,系统会根据用户的使用需要和实际的运行情况来灵活进行调整。在运行一段时间后,系统还会提供策略模板,根据项目阶段和最终用户的实际情况产生推荐值,此外用户也可以自己随时调整。管理中心希望将来可以加入时间列表等手段将故障事件或等级类别纳入其中,将告警级别高的故障预警自动显示出来。下一步会重点研究省级告警信息和骨干业务层面节点设备的告警信息。
在平台部署时也是如此,电子政务外网如此大规模的管理部署只进行了一个月左右,系统调试就已经基本完成。在模版设置好后,系统的自动发现功能可以自动发现新增设备,将其纳入拓扑图中,有些省份三天就可以全部完成。
吴阿明透露说,目前已经有12个省级单位使用该平台,下一步会进行预备管理平台的搭建,包括和其他子系统进行对接,和下级系统进行对接等。管理中心还会制定相关管理规范,统一规范管理接口,保证和其他运维异构平台的顺利整合。
规模大、应用多
覆盖80个中央政务部门和相关单位,管理31个省、自治区、直辖市和新疆生产建设兵团,并能够让20多个中央政务部门的全国业务系统在这张“大网”上稳定运行。这样一张规模大、覆盖面广的复杂网络,其运维管理人员还不到20人,究竟是如何做到的呢?
“国家电子政务网”是在工业和信息化部电子科学技术委员会及工业和信息化部基础产品发展研究中心指导下,建立的全国最早的、系统全面的介绍电子政务建设、信息化建设的专业网站。由基于国家电子政务传输网的政务内网和政务外网组成。其中,国家电子政务网络政务内网由党委、人大、政府、政协、法院、检察院的业务网络互联互通形成,主要满足各级政务部门内部办公、管理、协调、监督和决策的需要,同时满足副省级以上政务部门的特殊办公需要;政务外网主要满足各级政务部门社会管理、公共服务等面向社会服务的需要。
政务外网由国家信息中心负责承建,该网目前已连接中央政务部门80个,连接31个省、自治区、直辖市和新疆生产建设兵团,成为我国覆盖面最广,连接部门最多,规模最大的政务公用网络。
目前,电子政务外网已经承载了中纪委监察部、国务院应急办、国务院扶贫办、国家审计署、国家安监总局等20多个中央政务部门的全国性业务应用。国家发展改革委、人力资源和社会保障部、中编办等十多个中央政务部门使用政务外网互联网出口,实现了政务公开和公共服务业务。环保部、卫生部业务应用的部署也正在逐步展开,人社部金保二期工程、公安部人口库等项目也已有意向依托政务外网运行。另据不完全统计,各地基于政务外网部署的行政审批、电子监察、应急平台、社会保障、文化共享等业务应用系统总计已达1200多项。为各地提高为民服务水平,提升行政效率,节约财政经费起到了积极作用。
随着电子政务外网规模逐渐增大、接入的政务部门逐渐增多,电子政务外网业务所面临的运维管理问题日益凸显。
对接整合是难点
国家电子政务外网管理中心外网办运行管理处副处长吴阿明介绍说,电子政务外网是一个比较复杂的网络,它不像部委网络采取的多级架构,而是由省级和中央级网络两大管理核心组成。其中省网是早已建好的独立网络,所以两大管理核心的对接整合成为难点。
从结构上来讲,各大部委都有自己的结构路由器,各省有落地路由器。这些设备、线路、链接都由管理中心进行管理。以管理中心的运维平台为总平台,将省级和其他网管系统纳入体系,实现相互之间的协同和数据共享,以保证端到端的业务交互。
从应用上来说,吴阿明认为电子政务外网主要有四大需求,定位需求、管理人需求、决策人需求以及用户需求。“你可以理解为类似运营商的网络,既面向工信部用户,也要面向省里和其他用户,因此要求运维体系要能够监控所有网络,出现问题及时解决。除此之外还有流程、资源管理、服务管理等需求,并在此基础上进行整合。”他说。“由于不仅涉及到同种系统对接,还涉及到异构系统对接,这是一个不小的挑战。”
因此,在整合方面有很多技术问题是管理中心难以独立解决的,他们希望找到一个战略合作伙伴来一起进行。除了技术上的支持外,管理中心更需要方法上的建议以及战略合作伙伴按照他们的需求进行持续改进的能力。2012年5月,管理中心选择了锐捷网络RIIL IT综合业务管理平台作为总控制台来管理政务外网。迄今为止,他们已经基于该平台完成了不少改进,与异构网络的对接管理工作也不再成为问题。
满足可视化需求
网络运维管理,监控很重要。“首先要快速发现并定位故障;其次要掌握整个网络运行情况并进行分析;最后要将运行情况呈现给上级管理部门,并将业务运行情况反馈给用户。此外,管理中心和省网之间要进行协同,保障部委多级纵向业务在网络上的运行,还要注意在运维中加强和省网之间的协调。”吴阿明说。
除此之外,对于复杂的网络管理还有一个重要要素是可视化。
传统的机房监控只能看到温湿度、是否漏水、烟感UPS等内容,而要实现故障快速准确定位,要求信息量更精确,内容能够可视化,通过拓扑图中的信息很难直接表达呈现。在RILL运维平台上双击数据区之后,可以看到数据区的机房结构,还可以用3D方式通过各个视角来察看资源情况。可以具体查看机柜中的各种设备,包括显示、运行状态以及其他基础信息。这些都可以根据运维属性以及配制属性进行定制。发生故障时,值班人员可以看到具体是哪一个机柜的哪些设备出了问题。
故障定位后,系统会自动发送告警信息。告警方式有短信、邮件等类型,但由于电子政务外网是涉密网站,目前告警方式主要通过邮件来进行。而告警条件的设置,则要根据业务情况进行选择。可以设定规则形成模板,之后应用到各个资源之上。在项目实施的初级阶段,系统会根据用户的使用需要和实际的运行情况来灵活进行调整。在运行一段时间后,系统还会提供策略模板,根据项目阶段和最终用户的实际情况产生推荐值,此外用户也可以自己随时调整。管理中心希望将来可以加入时间列表等手段将故障事件或等级类别纳入其中,将告警级别高的故障预警自动显示出来。下一步会重点研究省级告警信息和骨干业务层面节点设备的告警信息。
在平台部署时也是如此,电子政务外网如此大规模的管理部署只进行了一个月左右,系统调试就已经基本完成。在模版设置好后,系统的自动发现功能可以自动发现新增设备,将其纳入拓扑图中,有些省份三天就可以全部完成。
吴阿明透露说,目前已经有12个省级单位使用该平台,下一步会进行预备管理平台的搭建,包括和其他子系统进行对接,和下级系统进行对接等。管理中心还会制定相关管理规范,统一规范管理接口,保证和其他运维异构平台的顺利整合。