论文部分内容阅读
当今随着IT技术的迅猛发展,各行各业都十分重视信息化建设,使IT技术与业务深度融合,业务的开展越来越依托于IT支撑,IT基础设施和系统的稳定性直接影响着业务的连续性。在IT基础设施和系统的生命周期中包含4个阶段,即规划和设计、采购和实施、运行和维护、废弃,其中运行和维护在行业内简称为“运维”,是生命周期中持续时间最长的一个阶段,也是对业务的连续性影响最大的阶段。但在公司信息化建设的初期强调“科技创新”和“技术赋能”的背景下,恰恰因为IT运维这个阶段不能直接引领业务变革,很难直观量化对业务的价值,所以往往得不到关注。随着IT系统的应用和技术设施的规模逐渐庞大,故障和问题常常得不到有效的处理和预防,原有被动触发式管理模式的“天花板”逐渐暴露,持续增加的运维人力和资金的投入,和运维事件的数量有增无减管理现状产生矛盾。IT组织的运维意识开始加强,保障IT系统和基础设施的持续可用被提上管理日程,运维开始朝向主动式和规范化变革。一汽资本控股有限公司IT的运维管理正处在这个管理的变更期。从2012年公司成立之初,并未设计专门的运维岗位,由基础设施和系统的建设者兼职承接运维任务。到设立专门的部门和岗位归口管理,培养内部运维人员能力,引入第三方外包团队承接操作层面的运维工作,运维任务得到更及时解决。但随着团队规模扩大,分工逐渐精细,人员能力和态度的差异,又产生了新的管理问题,如任务分配不均产生的内部矛盾、问题解决不彻底引发的员工投诉、处理不当引发更多更严重的运维事件、沟通和协作不畅导致互相推诿等等。本人在负责一汽资本控股有限公司的运维管理工作中深刻体会到,目前运维工作对外呈现出的高人力投入低价值产出、人员忙碌却风险事件频发的工作状态并非再是技术能力层面问题,而是缺少规则、疏于控制、内部运行混乱的管理层面问题导致,成体系的梳理职责、制度、规范、流程等管理工作才是改善运维工作开展效果的核心。本文以一汽资本控股有限公司IT运维的管理现状出发,分析目前运维管理流程中存在的诸多问题,借鉴IT行业成熟的运维服务管理方法论中的分类和流程,重新规划IT运维管理流程框架和流程规则。首先从转变运维工作职责划分的视角出发,重新规划组织,升级成立虚设团队和岗位。由目前基于管理对象的团队分组,如桌面组、服务器组、系统组、网络组,转化为基于过程管理的事件组、问题组、变更组等等。其次按照过程管理需要和人员能力,在组内划分职责和技术层级,如服务受理人员、一线运维、二线运维、厂商运维等等,合理的平衡工作量,使低技术能力人员工作饱和,高技术能力专注于攻坚和优化。再次,关注流程内的闭环管理和流程间的升级转换,重新定义规则,使过程有跟踪、有控制、可溯源,有效提升一次性解决率和控制风险能力。最后,配套建立其他必要支撑流程和系统,线上管理和记录保证多方的信息一致。实施流程优化后,预期达到如下效果。第一,所有运维事件将按照既定规则处理,有线上的过程跟踪和控制,运维处理的效果和风险不在依托于个人的工作态度和技术能力。第二,跟踪流程执行过程,合理调整人员分布,使人员工作量充分饱和技术能力合理利用。第三,组织内进一步提升协作能力,处置过程可追根溯源,管理和统计信息一致,以支撑持续的流程优化改进。