论文部分内容阅读
一、概述
国内某银行的核心业务系统部署在2台IBM AS400服务器上,2007年上线,采用Vision OMS构建基于数据库日志复制技术的业务连续性方案。2011年启动灾备项目建设,把核心拓扑结构扩展为3个节点。在本地生产机房部署两个节点,在生产机发生异常的情况下切换到本地备机;在远程灾备机房部署灾备机,在生产机房发生停电、火灾等异常的情况下,外围服务器连接到灾备机房保持银行核心基本业务的顺畅、持续运行。
本文以该银行的灾备项目为背景,对基于IBM AS400+ Vision OMS的业务连续性方案的设计、实施、验证等环节进行展开。
二、基于OMS的核心业务拓扑结构
该银行核心业务系统部署在3个节点上,生产机房2个节点,灾备机房1个节点。该方案的典型特征为:(1)生产机房部署所有需要的外围设备,承担所有银行业务;而灾备机房受到空间的限制通常仅部署最核心的外围支持系统,仅能承担少数核心银行业务。(2)生产机房和灾备机房之间通常使用150MB的带宽即可满足OMS复制的需要。
三、OMS切换操作
高可用方案设计的目的就是要通过switch-over或者fail-over来实现业务连续运行。根据切换场景的不,有两种可能出现的场景:(1)计划切换;(2)非计划切换。计划性切换,通常发生在以下场景中:(1)生产机硬件维护,例如更换RAID卡电池,更换已经损坏的冗余电源;(2)更换RAID5阵列发生损坏的硬盘等;(3)主机操作系统,或重要软件的升级;(4)安装PTF。
计划性切换也需要安排业务中断,通常会安排在周末夜晚进行,以便最大限度的减小对生产的影响。
非计划切换则往往发生在主机发生异常故障,已经无法负担生产任务的情况下,切换到备份机继续运行业务的场景。非计划切换发生的情况包括:(1)主机发生关键硬件故障;(2)生产机出现宕机等异常情况,业务性能降低严重影响业务;(3)出现系统或数据库异常,修复时间超过允许范围。
切换是一个复杂的过程,除了完成数据库对象的反向复制以外,还需要考虑到业务连续性的要求,外围设备的连接等综合的要求。通常的业务切换需要考虑以下环节:(1)IP interface的切换;(2)Job Schedule Entry的设置;(3)User Profile的设置。
正常情况下,业务在生产机运行,备份机和灾备机作为复制的目标节点。
当切换到备份机以后,GRPA复制链路执行change role动作,翻转复制的方向;同时激活GRPC,实现从备份机到灾备机的数据复制;同时需要停止由生产到灾备的复制链路GRPB。
当切换到灾备以后,GRPB复制链路反向,GRPC复制链路反向,停止GRPA复制链路。
非计划切换:(1)进入OMS400主菜单,在连接前选2并执行切换,备份机状态将从Normal Target改为SOURCE REVERSE。根据生产机宕机时备份机上的状态,该过程可能会比正常的切换慢。(2)在备份机上输入:ADDLIBLE ODS400,回车。输入INZODS,回车。(3)在备份机上输入ODS400命令,进入ODS主菜单。(4)选择选项6(Change System Role),并输入回车。(5)在备份机上激活生产用IP地址。方法为:CFGTCP;选1 Work with TCP/IP interface,回车;找到相关IP地址,在其前面选9,回车,在按安F5刷新,直到该地址变成ACTIVE。(6)这时备份机已经接替生产机的工作,用户可以用原有的IP地址访问系统,作业实际发生在备份机上。(7)修复生产机。在确保其生产用网线仍未连接交换机的前提下开机。在生产机终端上用QSECOFR登录。(8)在生产机上,关闭生产用IP地址,方法是:CFGTCP;选1 Work with TCP/IP interface,回车;找到相关IP地址,在其前面选10 ( END ),回车,再按F5刷新,直到该地址变成INACTIVE。(9)在生产机上用QSECOFR登录。(10)在生产机上确认没有其他终端连接时,输入命令OMS400并回车执行,以进入OMS400的主菜单。可以看到连接PRDBCK。其状态是:SOURCE NORMAL。(11)在这个连接前选2并执行。生产机将进行切换,其状态变成TARGET REVERSE。(12)在生产机上,输入ODS400命令,进入ODS主菜单。(13)选择选项6(Change System Role),并输入回车。(14)在备份机上输入STROMS,并确认OMS在备份机上已经启动。(15)在生产机上输入STROMS,并确认OMS在生产机上已经启动。(16)在备份机上输入STRODS。(17)系统将用一段时间追同步。(18)重新连接生产机对外的网线。(19)激活生产机上的备份用IP地址。(20)这时两台机器的状态类似于计划切换后的状态。用户可以用生产用IP地址访问系统,但作业运行在备份机上,生产机在追同步后将继续备份原备份机上的数据。(21)等追同步后反向切换将两系统的角色重置。
四、结束语
银行投资搭建的基于OMS的高可用架构就是为了在生产机无法继续正常运行的情况下把生产切换到运行能力相当的备份机或灾备机,保证银行业务的连续运行。每年进行2到3次的计划切换,一方面验证切换流程的正确性,一方面也加强运维人员对切换流程的熟练程度。随着我国经济的高速发展,即使是核心业务也要经常发生变更,而这些变更是否会对切换造成影响,除了在理论上进行验证,也必须通过切换实战来进行验证。
国内某银行的核心业务系统部署在2台IBM AS400服务器上,2007年上线,采用Vision OMS构建基于数据库日志复制技术的业务连续性方案。2011年启动灾备项目建设,把核心拓扑结构扩展为3个节点。在本地生产机房部署两个节点,在生产机发生异常的情况下切换到本地备机;在远程灾备机房部署灾备机,在生产机房发生停电、火灾等异常的情况下,外围服务器连接到灾备机房保持银行核心基本业务的顺畅、持续运行。
本文以该银行的灾备项目为背景,对基于IBM AS400+ Vision OMS的业务连续性方案的设计、实施、验证等环节进行展开。
二、基于OMS的核心业务拓扑结构
该银行核心业务系统部署在3个节点上,生产机房2个节点,灾备机房1个节点。该方案的典型特征为:(1)生产机房部署所有需要的外围设备,承担所有银行业务;而灾备机房受到空间的限制通常仅部署最核心的外围支持系统,仅能承担少数核心银行业务。(2)生产机房和灾备机房之间通常使用150MB的带宽即可满足OMS复制的需要。
三、OMS切换操作
高可用方案设计的目的就是要通过switch-over或者fail-over来实现业务连续运行。根据切换场景的不,有两种可能出现的场景:(1)计划切换;(2)非计划切换。计划性切换,通常发生在以下场景中:(1)生产机硬件维护,例如更换RAID卡电池,更换已经损坏的冗余电源;(2)更换RAID5阵列发生损坏的硬盘等;(3)主机操作系统,或重要软件的升级;(4)安装PTF。
计划性切换也需要安排业务中断,通常会安排在周末夜晚进行,以便最大限度的减小对生产的影响。
非计划切换则往往发生在主机发生异常故障,已经无法负担生产任务的情况下,切换到备份机继续运行业务的场景。非计划切换发生的情况包括:(1)主机发生关键硬件故障;(2)生产机出现宕机等异常情况,业务性能降低严重影响业务;(3)出现系统或数据库异常,修复时间超过允许范围。
切换是一个复杂的过程,除了完成数据库对象的反向复制以外,还需要考虑到业务连续性的要求,外围设备的连接等综合的要求。通常的业务切换需要考虑以下环节:(1)IP interface的切换;(2)Job Schedule Entry的设置;(3)User Profile的设置。
正常情况下,业务在生产机运行,备份机和灾备机作为复制的目标节点。
当切换到备份机以后,GRPA复制链路执行change role动作,翻转复制的方向;同时激活GRPC,实现从备份机到灾备机的数据复制;同时需要停止由生产到灾备的复制链路GRPB。
当切换到灾备以后,GRPB复制链路反向,GRPC复制链路反向,停止GRPA复制链路。
非计划切换:(1)进入OMS400主菜单,在连接前选2并执行切换,备份机状态将从Normal Target改为SOURCE REVERSE。根据生产机宕机时备份机上的状态,该过程可能会比正常的切换慢。(2)在备份机上输入:ADDLIBLE ODS400,回车。输入INZODS,回车。(3)在备份机上输入ODS400命令,进入ODS主菜单。(4)选择选项6(Change System Role),并输入回车。(5)在备份机上激活生产用IP地址。方法为:CFGTCP;选1 Work with TCP/IP interface,回车;找到相关IP地址,在其前面选9,回车,在按安F5刷新,直到该地址变成ACTIVE。(6)这时备份机已经接替生产机的工作,用户可以用原有的IP地址访问系统,作业实际发生在备份机上。(7)修复生产机。在确保其生产用网线仍未连接交换机的前提下开机。在生产机终端上用QSECOFR登录。(8)在生产机上,关闭生产用IP地址,方法是:CFGTCP;选1 Work with TCP/IP interface,回车;找到相关IP地址,在其前面选10 ( END ),回车,再按F5刷新,直到该地址变成INACTIVE。(9)在生产机上用QSECOFR登录。(10)在生产机上确认没有其他终端连接时,输入命令OMS400并回车执行,以进入OMS400的主菜单。可以看到连接PRDBCK。其状态是:SOURCE NORMAL。(11)在这个连接前选2并执行。生产机将进行切换,其状态变成TARGET REVERSE。(12)在生产机上,输入ODS400命令,进入ODS主菜单。(13)选择选项6(Change System Role),并输入回车。(14)在备份机上输入STROMS,并确认OMS在备份机上已经启动。(15)在生产机上输入STROMS,并确认OMS在生产机上已经启动。(16)在备份机上输入STRODS。(17)系统将用一段时间追同步。(18)重新连接生产机对外的网线。(19)激活生产机上的备份用IP地址。(20)这时两台机器的状态类似于计划切换后的状态。用户可以用生产用IP地址访问系统,但作业运行在备份机上,生产机在追同步后将继续备份原备份机上的数据。(21)等追同步后反向切换将两系统的角色重置。
四、结束语
银行投资搭建的基于OMS的高可用架构就是为了在生产机无法继续正常运行的情况下把生产切换到运行能力相当的备份机或灾备机,保证银行业务的连续运行。每年进行2到3次的计划切换,一方面验证切换流程的正确性,一方面也加强运维人员对切换流程的熟练程度。随着我国经济的高速发展,即使是核心业务也要经常发生变更,而这些变更是否会对切换造成影响,除了在理论上进行验证,也必须通过切换实战来进行验证。