论文部分内容阅读
【摘 要】经济发展形势下,企业之间所面临的竞争也变得越来越激烈。在社会经济和数据信息技术持续发展中,数据中心现已成为影响企业稳步运行的重要因素。加强企业级数据中心运维管理能够节省人力,让相关的技术人员可以全身心的投入到系统、流程的优化工作中,逐步实现数据中心运维管理自动化,节约成本,企业通过数据中心的自动化管理能够更安全、有效的展开工作。本文就企业级数据中心运维管理展开探讨。
【关键词】IT运维;运维管理规范;安全运维管理
引言
数据中心运维管理需要灵活的管理机制和方法,让各技术层面协同工作有机配合并不容易,同时也需要企业数据中心管理人员提高管理水平,加强运维管理,向着高可用、高效稳定、低成本和运维管理自动化的方向发展。为此,我们需要进一步分析和探讨数据库中心的运维管理现状,不断完善和改进运维管理手段和能力,全方位提高运维管理水平。
1企业级数据中心运维管理面临的挑战
从上层业务的角度看,数据中心最重要的工作之一是计算,因此需要保障数据库、服务器、中间件、Web等各种关键业务的正常运行,并根据性能参数和业务流量进行优化调整;从基础设施角度看,需要将各种管理工具进行整合,在一个平台里管理路由器、交换机、安全、存储、服务器等各种设备,同时适应数据中心特有的可视化管理需求;从运维和服务的角度看,数据中心IT部门提供的服务流程是否合理,服务质量是否有保障,直接影响到业务部门的各种业务是否正常开展;从技术发展趋势看,数据中心在完成标准化之后,要向自动化方向发展,就必须管理好硬件设备、软件、网络、安全、存储等各种逻辑的、虚拟化的各种资源池等。因此,对数据中心的运行管理需要采用全新的管理模型和灵活的功能架构,并且充分考虑基础设施、技术趋势、业务运行、运维服务等各种管理要素,建立一个开放式、标准化、易扩展、可联动的统一智能管理平台,实现数据中心自动化管理。
2企业级数据中心运维管理工作范围
企业级数据中心运维管理工作主要包含4个部分,其一是数据中心信息系统的运维管理,数据中心的信息系统主要包括运营支撑系统、企业资源管理系统、客户服务系统、办公自动化系统、监控系统等多种数据信息系统以及承载的小型机、服务器和网络设备等硬件资源。其二是数据中心数据库及存储管理,数据库是系统的核心,存储是承载数据的硬件设备,保证数据库及数据安全和存储管理是数据中心运维管理工作的重中之重。其三是数据中心机房的网络管理,对网络设备包括交换机、路由器、防火墙、负载均衡等设备进行统一配置和管理,保证网络的正常运行。其四是数据中心机房环境管理,对数据中心的监控以及机房环境进行管理,运维对象包括入侵监测系统、精密空调、视频监控、环境监控、门禁系统、电力设备系统、消防系统等。数据中心运维管理的主要任务是配置管理、变更管理、故障管理、监控管理以及资源管理。配置管理主要是指对数据中心的核心系统、核心设备以及机房环境等配置相应的档案库,提高数据中心的运维管理水平,充分调动管理人员的工作积极性和主动性。变更管理主要是指根据数据中心的业务需求和运维管理需求,对网络配置、存储资源、软件系统、硬件设备、机房环境,调整业务数据,升级和更换参数配置。故障管理主要是指数据中心对相关部门反映的问题和运维管理中出现的问题,及时进行处理和解决。监控管理是指对网络系统的运行性能和运行状况、存储系统、信息系统、主机设备、机房环境等进行实时监控,定期进行巡检和维护,全面掌握系统运行情况和运行趋势。资源管理是指对数据中心的网络资源、存储资源、主机资源以及环境资源进行管理规划,优化资源配置,根据不同的需求及时调整资源配置,提高数据中心资源利用率。
3提高企业级数据中心运维管理能力的有效策略
3.1提高运维管理人员的综合素质,加强团队建设
开展数据中心运维管理的系统化、专业化培训,重视运维技术的学习,激励管理人员探究数据中心的信息系统建设,提高对企业的认同感。运维人员管理问题,关键在于运维工作分配业绩考核。可将运维人员根据技能层次水平分成一、二、三线支持,不同运维人员各司其职,能使有限的运维力量得到合理利用,整體工作效率将明显提升,同时也方便对各自的工作业绩进行评估,再据此制定相应奖惩措施和制定技能培训规划,也能提高员工工作积极性。加强运维团队的建设和管理,有利于沉淀内部知识积累,快速培训新员工,减少核心员工离职带来的冲击。
3.2企业级数据中心的安全运维管理
根据系统的重要性网络安全、密集程度等因素企业级数据中心可以分为安全域和实施信息安全等级进行保护。根据不同的需求可以对信息安全资源进行优化整合,构建数据中心应急响应系统和灾难备份系统,将信息安全设备的作用充分发挥出来。不断的提升保障体系建设,并逐步的完善相关的安全机制,根据相应的安全管理制度,加强数据中心安全和防护能力。所以,企业级数据中心在进行安全体系建设时要结合实际情况,采取相应的安全措施,依法办事,让安全防护体系的构架更完善。
3.3企业级灾备中心的运维管理
大型的数据中心都建有相应的灾备中心,灾备中心建设后,应当建立健全的灾难恢复管理制度及灾备中心运营管理制度:主要包括有灾难报告制度,灾难恢复审批制度、灾难恢复处理流程、备份系统日常运行管理制度、备份系统替代运行状态下的运行制度、数据一致性认可程序、生产系统复原后的回切处理流程、备份系统测试、灾难演习制度等等,这些制度都是确保灾备业务正常运营的强有力的措施,为今后的灾备业务的价值发挥起到关键支撑作用。灾备中心的运营管理非常复杂,从日常的运维到灾难发生时的应急响应、恢复和回退,是一个专业的、持续运行的过程。
3.4确立以业务价值为核心的业务驱动管理的管理思想
首先需要找出数据中心信息系统和业务环境之间的关联因素,深入分析业务环境对信息系统的影响。其次,仔细分析业务环境的变化内容,研究业务发展趋势。最后,正确分析业务环境影响因素,评估业务环境的风险,提高数据中心建设发展决策能力。要在运维管理的战略层面上建立“业务驱动”的运维治理和管理思想,使得业务部门的目标和运维管理的目标一致,都是为了企业整体战略目标的实现,把对业务的支撑能力和管理实效,作为评价IT系统效用和运维部门工作的首要指标。只有这样,才能在全企业范围内建立“技术服务于业务发展”的意识和文化,是真正实现IT与业务融合,共同为企业的战略目标服务。
3.5企业级数据中心运维管理的自动化
实现数据中心的自动化管理是数据中心的发展方向,如今IT服务管理成本逐步加大,其运维风险也不断升高,所以需要通过数据中心自动化管理实现IT运维自动化,让IT团队实现资源转型,提高服务水平。
结语
企业级数据中心运维管理是对计算机系统进行综合集中管理,既面向资源又面向应用,同时还面向运维管理人员,是人才、技术、流程和工具紧密结合的系统工程,要不断创新运维管理思路和方式,采用先进科学的技术手段,使企业级数据中心运维管理水平达到新高度,以适应时代发展的需要。
参考文献:
[1]朱伟雄,王德安,蔡建华.新一代数据中心建设理论与实践[M].北京:人民邮电出版社,2017.
[2]林予松,李润知,刘炜.数据中心设计与管理[M].北京:清华大学出版社,2017(8).
(作者单位:信息化管理中心普光项目部)
【关键词】IT运维;运维管理规范;安全运维管理
引言
数据中心运维管理需要灵活的管理机制和方法,让各技术层面协同工作有机配合并不容易,同时也需要企业数据中心管理人员提高管理水平,加强运维管理,向着高可用、高效稳定、低成本和运维管理自动化的方向发展。为此,我们需要进一步分析和探讨数据库中心的运维管理现状,不断完善和改进运维管理手段和能力,全方位提高运维管理水平。
1企业级数据中心运维管理面临的挑战
从上层业务的角度看,数据中心最重要的工作之一是计算,因此需要保障数据库、服务器、中间件、Web等各种关键业务的正常运行,并根据性能参数和业务流量进行优化调整;从基础设施角度看,需要将各种管理工具进行整合,在一个平台里管理路由器、交换机、安全、存储、服务器等各种设备,同时适应数据中心特有的可视化管理需求;从运维和服务的角度看,数据中心IT部门提供的服务流程是否合理,服务质量是否有保障,直接影响到业务部门的各种业务是否正常开展;从技术发展趋势看,数据中心在完成标准化之后,要向自动化方向发展,就必须管理好硬件设备、软件、网络、安全、存储等各种逻辑的、虚拟化的各种资源池等。因此,对数据中心的运行管理需要采用全新的管理模型和灵活的功能架构,并且充分考虑基础设施、技术趋势、业务运行、运维服务等各种管理要素,建立一个开放式、标准化、易扩展、可联动的统一智能管理平台,实现数据中心自动化管理。
2企业级数据中心运维管理工作范围
企业级数据中心运维管理工作主要包含4个部分,其一是数据中心信息系统的运维管理,数据中心的信息系统主要包括运营支撑系统、企业资源管理系统、客户服务系统、办公自动化系统、监控系统等多种数据信息系统以及承载的小型机、服务器和网络设备等硬件资源。其二是数据中心数据库及存储管理,数据库是系统的核心,存储是承载数据的硬件设备,保证数据库及数据安全和存储管理是数据中心运维管理工作的重中之重。其三是数据中心机房的网络管理,对网络设备包括交换机、路由器、防火墙、负载均衡等设备进行统一配置和管理,保证网络的正常运行。其四是数据中心机房环境管理,对数据中心的监控以及机房环境进行管理,运维对象包括入侵监测系统、精密空调、视频监控、环境监控、门禁系统、电力设备系统、消防系统等。数据中心运维管理的主要任务是配置管理、变更管理、故障管理、监控管理以及资源管理。配置管理主要是指对数据中心的核心系统、核心设备以及机房环境等配置相应的档案库,提高数据中心的运维管理水平,充分调动管理人员的工作积极性和主动性。变更管理主要是指根据数据中心的业务需求和运维管理需求,对网络配置、存储资源、软件系统、硬件设备、机房环境,调整业务数据,升级和更换参数配置。故障管理主要是指数据中心对相关部门反映的问题和运维管理中出现的问题,及时进行处理和解决。监控管理是指对网络系统的运行性能和运行状况、存储系统、信息系统、主机设备、机房环境等进行实时监控,定期进行巡检和维护,全面掌握系统运行情况和运行趋势。资源管理是指对数据中心的网络资源、存储资源、主机资源以及环境资源进行管理规划,优化资源配置,根据不同的需求及时调整资源配置,提高数据中心资源利用率。
3提高企业级数据中心运维管理能力的有效策略
3.1提高运维管理人员的综合素质,加强团队建设
开展数据中心运维管理的系统化、专业化培训,重视运维技术的学习,激励管理人员探究数据中心的信息系统建设,提高对企业的认同感。运维人员管理问题,关键在于运维工作分配业绩考核。可将运维人员根据技能层次水平分成一、二、三线支持,不同运维人员各司其职,能使有限的运维力量得到合理利用,整體工作效率将明显提升,同时也方便对各自的工作业绩进行评估,再据此制定相应奖惩措施和制定技能培训规划,也能提高员工工作积极性。加强运维团队的建设和管理,有利于沉淀内部知识积累,快速培训新员工,减少核心员工离职带来的冲击。
3.2企业级数据中心的安全运维管理
根据系统的重要性网络安全、密集程度等因素企业级数据中心可以分为安全域和实施信息安全等级进行保护。根据不同的需求可以对信息安全资源进行优化整合,构建数据中心应急响应系统和灾难备份系统,将信息安全设备的作用充分发挥出来。不断的提升保障体系建设,并逐步的完善相关的安全机制,根据相应的安全管理制度,加强数据中心安全和防护能力。所以,企业级数据中心在进行安全体系建设时要结合实际情况,采取相应的安全措施,依法办事,让安全防护体系的构架更完善。
3.3企业级灾备中心的运维管理
大型的数据中心都建有相应的灾备中心,灾备中心建设后,应当建立健全的灾难恢复管理制度及灾备中心运营管理制度:主要包括有灾难报告制度,灾难恢复审批制度、灾难恢复处理流程、备份系统日常运行管理制度、备份系统替代运行状态下的运行制度、数据一致性认可程序、生产系统复原后的回切处理流程、备份系统测试、灾难演习制度等等,这些制度都是确保灾备业务正常运营的强有力的措施,为今后的灾备业务的价值发挥起到关键支撑作用。灾备中心的运营管理非常复杂,从日常的运维到灾难发生时的应急响应、恢复和回退,是一个专业的、持续运行的过程。
3.4确立以业务价值为核心的业务驱动管理的管理思想
首先需要找出数据中心信息系统和业务环境之间的关联因素,深入分析业务环境对信息系统的影响。其次,仔细分析业务环境的变化内容,研究业务发展趋势。最后,正确分析业务环境影响因素,评估业务环境的风险,提高数据中心建设发展决策能力。要在运维管理的战略层面上建立“业务驱动”的运维治理和管理思想,使得业务部门的目标和运维管理的目标一致,都是为了企业整体战略目标的实现,把对业务的支撑能力和管理实效,作为评价IT系统效用和运维部门工作的首要指标。只有这样,才能在全企业范围内建立“技术服务于业务发展”的意识和文化,是真正实现IT与业务融合,共同为企业的战略目标服务。
3.5企业级数据中心运维管理的自动化
实现数据中心的自动化管理是数据中心的发展方向,如今IT服务管理成本逐步加大,其运维风险也不断升高,所以需要通过数据中心自动化管理实现IT运维自动化,让IT团队实现资源转型,提高服务水平。
结语
企业级数据中心运维管理是对计算机系统进行综合集中管理,既面向资源又面向应用,同时还面向运维管理人员,是人才、技术、流程和工具紧密结合的系统工程,要不断创新运维管理思路和方式,采用先进科学的技术手段,使企业级数据中心运维管理水平达到新高度,以适应时代发展的需要。
参考文献:
[1]朱伟雄,王德安,蔡建华.新一代数据中心建设理论与实践[M].北京:人民邮电出版社,2017.
[2]林予松,李润知,刘炜.数据中心设计与管理[M].北京:清华大学出版社,2017(8).
(作者单位:信息化管理中心普光项目部)