论文部分内容阅读
选择建立一套切实可行,既可满足目前的业务需求,又能适应未来发展,具有良好性价比的数据存储系统并不是件容易的事情。
我国银行业正处在从专业银行向商业银行转型过程中,特别是加入WTO 后,使整个行业面临的竞争加剧。竞争环境的改变使我国银行业开始慢慢向以客户为中心转变,由原来的网点通道的竞争转向对客户服务的竞争。这种转变要求银行在任何时间、任何地点、任何渠道都能为客户服务。另外,这种转变还要求银行的数据存储系统能汇集、分散在各分支机构的信贷、会计和市场业务拓展等业务数据;能自动分类、整理、储存业务数据,以供银行内部管理人员作信贷审批、审查之用;能及时、准确地提供经营信息,供决策人员分析银行内部业务及其流程的合理性。这给业务数据的安全、可靠、高效存储提出了很高的要求。
我国银行的业务从过去只有普通对公和对私业务,发展到今天的网上银行、住房贷款、个人信贷、信用卡和信贷管理等多种业务,而且还处在不断发展过程中。大多数银行为了尽快推出新的业务和服务,在众多服务器上开发了众多的业务处理系统,这就必然增加银行的业务运营成本和系统维护难度,为众多业务系统建立灾难恢复系统的难度和成本也大大增加。
如何增加业务种类,提高服务质量,特别是提高业务系统的业务连续性成为各家银行普遍关注的焦点问题。如何利用有限的资金和现有资源来加强业务连续性,提高竞争力是我国银行的当务之急。“9·11”事件使人们再一次认识到灾难恢复系统对公司业务的重要性。但选择建立一套切实可行,既可满足目前的业务需求,又能适应未来发展,具有良好性价比的数据存储系统并不是件容易的事情,对银行来说更是如此,要求也更为迫切。
中国建设银行总行资金清算灾难备份系统应用
中国建设银行其分行遍及中国境内各大、中、小城市,与世界上600家银行建立了代理行关系,其业务往来遍及五大洲的近80个国家。随着该行各种业务的拓展,该行总行的资金清算业务在不断扩大。该行资金清算系统,是应用高科技电子化手段自行设计、自行开发的人民币多边净额资金清算系统。它集汇划、对账、查询查复、监控、账务核算等多项功能于一体,汇划与清算同步进行,是该行内部的资金枢纽,是资金流动的大动脉,而该行总行的资金清算系统更是这个资金枢纽的核心,它的安全稳定运行是保障该行核心业务顺利开展的关键。
不断增长的汇划业务量和汇划资金额要求该行总行的资金清算不能因为自然灾害、设备故障或人为因素等原因引起资金清算计算机系统停顿、数据丢失,导致清算业务处理的长时间中断。为了进一步增强该行总行资金清算系统抵御灾难的能力,使该行清算业务在发生计算机系统灾难后能够快速恢复,保证清算业务的连续性,该行总行决定建设资金清算系统的灾难备份系统,以使资金清算系统成为一个安全可靠的信息系统。
数据存储平台
中国建设银行总行应用于构建内部资金清算系统灾难备份系统选择的是企业级存储产品——EMC的智能企业存储系统 Symmetrix 3430。Symmetrix 3430企业智能存储系统存储容量大,不但可以集中该行目前所有的清算业务信息数据,实现该行清算业务数据的统一存储和共享,还可以大大减轻该行存储管理的后续开销和难度。Symmetrix 3430还具有良好的扩展性和伸缩性,支持多种系统平台如UNIX、Windows NT的共存,这不但连接了该行原有的不同主机和服务器,避免了该行的投资损失,而且可以使该行从容面对清算业务的不断扩大。
容灾备份
该行总行在相距20公里的生产中心和备份中心各使用了一台EMC Symmetrix 3430智能企业存储系统,二者之间通过高速光纤连接,采用的技术是ATM和楼间VLAN技术,并利用EMC的SRDF (SRDF是目前世界上成熟的远程灾难备份软件,能够对异地数据实行完全的、实时的数据镜像,迅速且完整地保护并恢复业务数据。)来实现生产中心到备份中心数据的实时同步备份。通过SRDF的实时镜像功能,该行总行的清算业务数据可以迅速地、有条不紊地在生产中心和备份中心之间转移,实现生产中心和备份中心数据的合并和现场工作负载的重新分配。同时,该行的IS人员就可以随便地在生产中心和备份中心之间切换,使得该行的各项业务在现场计划维护过程中也能得以继续进行,如操作系统升级,主处理器升级和环境中断等。当生产中心发生灾难时,通过SRDF,生产中心可以迅速切换到备份中心,保证业务的连续性。当生产中心的故障排除后,可以重新通信连接,SRDF可以使生产中心和备份中心之间的数据自动重新同步,恢复正常运行。
EMC TimeFinder软件为主机和开放系统数据存储器创建了与原数据卷完全一样,可独立寻址的业务连续卷(Business Continue Volume,简写为BCV)。BCV卷的建立,彻底解决了各种任务之间的时间冲突,如果与数据管理器(EDM)结合使用,则能够对开放系统数据库进行集中的随时备份,从而使冗长的数据备份工作变得流畅高效。借助于TimeFinder软件该行能够在不影响日常清算业务处理的同时,不知不觉中实现数据备份、数据库装载以及计划停机,进一步增强了灾难备份系统的可靠性。
另外,该行资金清算系统的灾难备份系统的主机、磁盘、通讯设备、通讯线路全部采用了硬件冗余。避免了因灾难备份系统中的单个设备或单条通讯线路的故障导致对整个业务清算系统运行的影响。
中国建设银行资金清算系统获得了强大的容灾能力,账务数据的安全有了保障、金融风险防范能力有了提高,服务质量有了改善,这必将提高中国建设银行的竞争能力,为保持中国建设银行在业界的领先地位起到应有的作用。
中国银行容灾/备份系统应用
中国银行其分支机构遍布全球,主营业务是传统的商业银行业务,包括了公司业务、零售业务和金融机构业务。银行规模不断扩大,业务种类快速增多,中国银行的企业计算环境数据量不断增加,原有的网络系统架构由于其本身的弱点和不足,已不能满足该行对存储和保护数据的要求。在中国银行决定重新整合其OA系统平台之前,采用的是直连式存储,这种存储方式具有管理复杂、性能低下、备份时间长、数据变化功能不足等缺点。为了快速处理不断增长的数据,提供更高的可用性和保障银行正常运行,中国银行配置了Network Appliance(NetApp)的Filer F820C。
中国银行OA系统是由两台IBM公司的RS/6000集群系统构成,作为数据库服务器,主机的操作系统是AIX 4.3.3。存储系统则采用了Network Appliance公司的F820C。网络交换机是采用了Cisco公司的两台4006。软件采用了Lotus Notes,存储系统容量是4T。
双机容错容灾方案
容错能力是银行业最基本的要求,OA系统直接关系到中行内部运作的及时畅通。每一分钟的数据停顿可能会导致一些关键任务无法得到及时执行,从而影响其他业务的后续执行。为了保证OA系统高可用性的要求,该行选择了Network Appliance公司Active-Active双机容错模型构建的容灾解决方案,平时提供负载均衡,发生故障时则能起到接管故障机,以保障数据访问服务不被中断。方案里采用双机容错式(Cluster)的存储组成高可靠、高可用的数据存储平台,每个机头通过网络捆绑技术把两块网卡设置为主备用方式,拥有同一个IP地址,并交叉连接到两台网络交换机上;前端的主机采用相应的集群软件,设置成集群容错模型,并分别连接到两台交换机上。当存储发生硬盘故障,系统有RAID进行保护;当存储系统的机头发生故障,另一个机头会接管故障机头的所有设备,保证数据能够继续服务;当网络链路发生中断,交换机会负责寻找迂回路由;当前端主机发生故障,则由另一台主机接管故障主机的业务,充分保证主机、网络、存储三个层面上的高可用性。使用NetApp Filer 比使用直联式存储效率高。通过快速以太网,可以提供200个用户同时连接到Filer,同时打开200 MB到300MB范围内的文件。
备份方案
中国银行使用NetApp Filer的SnapShot 功能加速了在线备份、性能调整、空间再分配和卷拷贝。SnapShot是NetApp Filer Data ONTAP操作系统的一个独特功能,可以保存多达31个只读数据的备份,它可以重新找回被删除的文件,或快速恢复到任意一个SnapShot状态。使用SnapShot,管理员可以用很小的空间实现在线全盘备份,可以在线恢复丢失或被删除的文件,无需帮助或从磁带恢复。在线快速备份和恢复是指系统利用现有的磁盘空间来进行备份,由于使用的是处于工作状态的磁盘,而不是速度较慢的磁带,故备份和恢复的速度非常快,并且方便灵活。利用存储设备的SnapRestore,可以大规模地恢复数据。此功能对于在系统遭受病毒感染、系统数据全盘误删除、升级软件、测试软件等情况尤为有用。通过网络,采用其内置的异地镜像软件SnapMirror,可以对远程系统进行增量数据备份,利用SnapMirror构建的远程容灾方案来应对可能发生的自然灾难(火灾、水灾等)、战争或系统永久性毁坏。NetApp的存储产品还具备2分钟重启的功能。不仅大大减少了管理维护的宕机影响时间,同时还保证即便在灾难掉电的情况下,系统亦可以迅速恢复文件服务。完整的备份方案还应该包含离线海量备份和恢复的部分。存储设备支持直接连接磁带机和通过第三方软件来控制和管理磁带库。
NetApp Filer的高可用性、高可靠性和优越性能得到了中国银行的认可。正是因为其卓越的性能表现,中国银行计划扩大它的任务,用于其它的数据服务。
交通银行数据备份系统应用
交通银行在全国86个大中城市的分支行都已开通了储蓄通存通兑,其中66个城市的分支行推广应用了将本外币、全储种同城通存通兑系统和太平洋卡处理系统融为一体,具有“一卡通”功能的新型零售业务处理系统。交通银行业务规模不断扩大,该行业务系统的数据量逐年增加,对系统稳定性和数据的可用性提出了新的要求。如何保障系统数据的安全,保障银行业务系统的正常运行越来越重要,该行对数据可用性提出了严格的要求。
数据保护系统
该行原来采用了一些技术保障系统防止单机故障,但如何在系统数据丢失和需要恢复时快速有效地恢复原有数据仍是交通银行特别重视的一方面。该行OA系统应当是一个覆盖较大区域、所有操作系统平台、各种数据库系统的统一的备份解决方案,并且满足实时的备份要求、远程的数据保护及快速的系统恢复等,普通的备份软件已远远不能适应需求。
该行总行首先考虑了总行信息系统的数据保护,对信息系统进行了重新规划和更新,新的系统部分采用了SAN存储结构。对于数据量大的部分采用IBM小型机,备份时考虑LAN-Free方式,采用其它服务器(Sun、Sco、NT、NetWare等)。对于备份的要求,主要分为三个部分:SAN结构中的数据库部分(主要是IBM S85上的Sybase数据库、要求在线、自动化数据备份)、LAN结构中的数据库部分(主要是LAN结构中SunE5500、IBM M85、M80等服务器上的Sybase和Domino数据库、要求在线、自动化数据备份)、LAN结构中的文件服务器部分(SCO Unix、NT文件系统,NAS服务器上的数据,大量数据文件、要求在线、自动化数据备份)。
备份管理
在整个数据保护系统中,该行总行采用了集中统一的备份策略管理,通过NetBackup SAN Master Server,对整个数据库和文件系统的备份工作进行集中的管理、监控。用IBM S85服务器作为SAN Master Server,负责整个备份系统的管理,包括备份策略的制订、备份数据库的保存。该服务器同时也是一个NetBackup SAN Media Server服务器,负责将本机的数据或客户端的数据备份到磁带库中。NetBackup SAN Media server安装在SAN结构中其它需要备份的服务器上,负责备份本地数据。NetBackup client安装在其它网络服务器上,负责将各自服务器上的数据通过网络送给主服务器备份。每台Sybase服务器还安装Sybase agent, 负责NetBackup与Sybase Backup Server的集成,完成Sybase数据库的在线热备份。每台Domino服务器还安装Domino agent, 负责NetBackup与Notes Backup/Restore API的集成,完成Domino数据库的在线热备份。该行总行的NAS设备采用了IBM的开放式NAS,其NAS服务器是由PC服务器和存储设备组成,因此直接在该NAS设备上安装NetBac- kup Client for NT/2000,而不通过NDMP进行(通过NDMP,需要有磁带机直接与NAS服务器连接)。实施了VERITAS BMR智能灾难恢复,当某服务器出现系统故障时(例如引导盘失效),可以不重新安装操作系统,快速进行系统恢复。一个大容量的STK磁带库,4个Driver,直接连接到光纤交换机。
中国交通银行总行信息系统备份项目的实施,为保护交行信息系统数据提供了保障。由于采用灵活的备份策略和统一的管理,管理员每天只需通过监控界面对备份任务进行监控,就可以对备份作业的执行情况了如指掌。由于采用了多个驱动器同时进行数据备份,每晚的备份作业可以在1个小时内全部完成。交行总行电脑部的技术人员介绍说:“VERITAS的备份软件在自动管理、系统保护等功能上比以前的类似软件有很大的提高,为我们的信息系统数据保护提供了很好的帮助,大大降低了系统的风险程度及人力资源成本。”
中行甘肃分行的数据整合
中国银行甘肃分行是中国西部主要的商业银行之一,配合中央西部大开发战略,中国银行甘肃分行加大了电子化建设步伐,原有的系统基本上是以城市为基础来建立电子系统和存储处理中心,在整个甘肃省有近十个处理中心。这些系统对中行甘肃分行的业务发展曾起到非常重要的作用,但由于处理中心规模各异,机型也比较复杂,处理能力和存储能力也相差比较大,导致了在管理大容量数据时,增加运行难度以及维护成本,同时也不利于业务的发展。由于各中心分别处理业务数据,各地市级行甚至无法形成一本完整的账,从而影响到省分行到总行就更不可能有一本完整的账。在一个商业银行内部,由于信息处理中心数量多,分布面广,必然导致各中心的功能差异很大、运行效率低下。同时,由于每个中心都要有一套生产系统,一套备份系统,重复投资、重复建设的矛盾十分突出,加上管理不善,浪费现象也十分严重,不利于全行集约化经营。
在数据分散处理的情况下,信息处理中心数量多、分布广,给经营管理带来许多难题:第一,各个中心掌握设备的购买权,各自都根据自己的需要和喜好购买设备,造成硬件和网络设备型号不统一;第二,各分行纷纷根据自己的需要开发自己的应用软件,致使应用软件版本五花八门,即使是总行统一下发的软件,往往也被改得面目全非,软件的不统一最终造成了业务做法的不一致;第三,由于中心多,数据分散,随着业务量的加大,风险越来越大,各类案件不断增多,加大了管理难度。每个中心各有自己的生产系统,自己的数据备份系统,重复投资比较严重;而且不同厂家,不同类型机器需要分别升级,可扩充的能力又各不相同,费用极高,不利于投资的保护。
存储整合解决方案
基于网络环境中存在的问题,中行甘肃分行选择了HP的XP512设备作为存储整合的中心设备,将分行现有的主机系统和新购置的HP-UX连接起来。HP XP512的数据带宽和容量充分满足了集中后的业务处理和存储的需要。
该系统一改过去以服务器为中心的存储模式,而是以数据存储为中心,采用伸缩的存储网络拓扑结构,通过具有高传输速度的光纤通道( 每条100MB/s)直接连接,提供了存储局域网(SAN)内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储局域网内,腾出空间,让网络可以处理关键性任务。多台服务器共享一个超大容量、高可靠的存储设备,因此主机通过光纤通道可以与存储设备建立任意两点之间的连接, 从而能形成一个被多个服务器通过多条路径访问的共享存储池,保证了更高的可用性。分布式服务器可以访问一个大的集中管理的存储子系统,各种应用共享数据。由于存储结构采用光纤通道连接方式,可以保证存储的高扩展性和主机系统平滑地扩容。
应用效果
使用单个超大容量、高可靠的存储设备,通过一个简单的Web管理工具(集成在OpenView软件)从一个中心控制平台对存储进行管理,从根本上改变了各市地级分行在业务处理上各自为政、分散经营的小生产格局,实现了集中式的统一管理。集中后可以接触数据的人员也相对比较集中,数量较少,使电脑犯罪的可能性极大降低;同时便于对数据进行集中的备份,提高了数据的安全性和可靠性,也保证了数据的完整性和真实性。数据集中后,当天便能生成各种相关报表,保证决策支持系统数据采集的及时有效,提供了中行的竞争能力,也减轻了统计业务人员的工作量。HP XP512具有良好的可扩展性,业务发展后,数据量增大,也不用频繁更新存储设备。同时,在将来的投资中,还可以考虑在异地建立一个容灾中心,HP XP512也可以很好的满足此类需要,不用重新更换设备。通过数据的存储整合,中国银行甘肃分行得以从繁重的存储任务中解脱出来,可以专注于其核心业务的发展。
日立数据系统有限公司专家建议
鉴于我国银行业务处理系统众多、资金有限等特点,灾难恢复系统的建立应分为以下三个步骤:
第一步:银行应完成对业务系统的整合,特别是对信息的整合,以便降低运营成本和维护难度,从而有效地降低灾难恢复系统的难度和成本。
第二步:银行应为关键业务数据提供实时备份。一个完备的灾难恢复系统的建立包括主机备份、网络备份和数据备份三个部分,其中数据备份是最关键的组成部分,它直接关系到灾难后数据的恢复。因此,为关键业务数据提供更可靠的保护是十分必要的。
第三步:银行应为关键业务建立灾难恢复系统。
灾难恢复系统的建立是一项较复杂的项目,投资较大。因此需要全面考虑,总的原则是以提高整个业务系统的业务连续性为准而非只是灾难恢复。主要考虑:开放性、标准化性、存储系统的性能工作能力、数据的一致性完整性和逻辑性、设计实施的简易性、产品的成熟性、先进性(是否面向SAN或NAS设计)、实施成本等。此外,还应制定一系列的管理制度以确保灾难恢复的实施。其中包括:灾难报告制度、灾难恢复审批流程、灾难恢复操作规程、灾难恢复培训制度、灾难恢复演习制度等。
我国银行业正处在从专业银行向商业银行转型过程中,特别是加入WTO 后,使整个行业面临的竞争加剧。竞争环境的改变使我国银行业开始慢慢向以客户为中心转变,由原来的网点通道的竞争转向对客户服务的竞争。这种转变要求银行在任何时间、任何地点、任何渠道都能为客户服务。另外,这种转变还要求银行的数据存储系统能汇集、分散在各分支机构的信贷、会计和市场业务拓展等业务数据;能自动分类、整理、储存业务数据,以供银行内部管理人员作信贷审批、审查之用;能及时、准确地提供经营信息,供决策人员分析银行内部业务及其流程的合理性。这给业务数据的安全、可靠、高效存储提出了很高的要求。
我国银行的业务从过去只有普通对公和对私业务,发展到今天的网上银行、住房贷款、个人信贷、信用卡和信贷管理等多种业务,而且还处在不断发展过程中。大多数银行为了尽快推出新的业务和服务,在众多服务器上开发了众多的业务处理系统,这就必然增加银行的业务运营成本和系统维护难度,为众多业务系统建立灾难恢复系统的难度和成本也大大增加。
如何增加业务种类,提高服务质量,特别是提高业务系统的业务连续性成为各家银行普遍关注的焦点问题。如何利用有限的资金和现有资源来加强业务连续性,提高竞争力是我国银行的当务之急。“9·11”事件使人们再一次认识到灾难恢复系统对公司业务的重要性。但选择建立一套切实可行,既可满足目前的业务需求,又能适应未来发展,具有良好性价比的数据存储系统并不是件容易的事情,对银行来说更是如此,要求也更为迫切。
中国建设银行总行资金清算灾难备份系统应用
中国建设银行其分行遍及中国境内各大、中、小城市,与世界上600家银行建立了代理行关系,其业务往来遍及五大洲的近80个国家。随着该行各种业务的拓展,该行总行的资金清算业务在不断扩大。该行资金清算系统,是应用高科技电子化手段自行设计、自行开发的人民币多边净额资金清算系统。它集汇划、对账、查询查复、监控、账务核算等多项功能于一体,汇划与清算同步进行,是该行内部的资金枢纽,是资金流动的大动脉,而该行总行的资金清算系统更是这个资金枢纽的核心,它的安全稳定运行是保障该行核心业务顺利开展的关键。
不断增长的汇划业务量和汇划资金额要求该行总行的资金清算不能因为自然灾害、设备故障或人为因素等原因引起资金清算计算机系统停顿、数据丢失,导致清算业务处理的长时间中断。为了进一步增强该行总行资金清算系统抵御灾难的能力,使该行清算业务在发生计算机系统灾难后能够快速恢复,保证清算业务的连续性,该行总行决定建设资金清算系统的灾难备份系统,以使资金清算系统成为一个安全可靠的信息系统。
数据存储平台
中国建设银行总行应用于构建内部资金清算系统灾难备份系统选择的是企业级存储产品——EMC的智能企业存储系统 Symmetrix 3430。Symmetrix 3430企业智能存储系统存储容量大,不但可以集中该行目前所有的清算业务信息数据,实现该行清算业务数据的统一存储和共享,还可以大大减轻该行存储管理的后续开销和难度。Symmetrix 3430还具有良好的扩展性和伸缩性,支持多种系统平台如UNIX、Windows NT的共存,这不但连接了该行原有的不同主机和服务器,避免了该行的投资损失,而且可以使该行从容面对清算业务的不断扩大。
容灾备份
该行总行在相距20公里的生产中心和备份中心各使用了一台EMC Symmetrix 3430智能企业存储系统,二者之间通过高速光纤连接,采用的技术是ATM和楼间VLAN技术,并利用EMC的SRDF (SRDF是目前世界上成熟的远程灾难备份软件,能够对异地数据实行完全的、实时的数据镜像,迅速且完整地保护并恢复业务数据。)来实现生产中心到备份中心数据的实时同步备份。通过SRDF的实时镜像功能,该行总行的清算业务数据可以迅速地、有条不紊地在生产中心和备份中心之间转移,实现生产中心和备份中心数据的合并和现场工作负载的重新分配。同时,该行的IS人员就可以随便地在生产中心和备份中心之间切换,使得该行的各项业务在现场计划维护过程中也能得以继续进行,如操作系统升级,主处理器升级和环境中断等。当生产中心发生灾难时,通过SRDF,生产中心可以迅速切换到备份中心,保证业务的连续性。当生产中心的故障排除后,可以重新通信连接,SRDF可以使生产中心和备份中心之间的数据自动重新同步,恢复正常运行。
EMC TimeFinder软件为主机和开放系统数据存储器创建了与原数据卷完全一样,可独立寻址的业务连续卷(Business Continue Volume,简写为BCV)。BCV卷的建立,彻底解决了各种任务之间的时间冲突,如果与数据管理器(EDM)结合使用,则能够对开放系统数据库进行集中的随时备份,从而使冗长的数据备份工作变得流畅高效。借助于TimeFinder软件该行能够在不影响日常清算业务处理的同时,不知不觉中实现数据备份、数据库装载以及计划停机,进一步增强了灾难备份系统的可靠性。
另外,该行资金清算系统的灾难备份系统的主机、磁盘、通讯设备、通讯线路全部采用了硬件冗余。避免了因灾难备份系统中的单个设备或单条通讯线路的故障导致对整个业务清算系统运行的影响。
中国建设银行资金清算系统获得了强大的容灾能力,账务数据的安全有了保障、金融风险防范能力有了提高,服务质量有了改善,这必将提高中国建设银行的竞争能力,为保持中国建设银行在业界的领先地位起到应有的作用。
中国银行容灾/备份系统应用
中国银行其分支机构遍布全球,主营业务是传统的商业银行业务,包括了公司业务、零售业务和金融机构业务。银行规模不断扩大,业务种类快速增多,中国银行的企业计算环境数据量不断增加,原有的网络系统架构由于其本身的弱点和不足,已不能满足该行对存储和保护数据的要求。在中国银行决定重新整合其OA系统平台之前,采用的是直连式存储,这种存储方式具有管理复杂、性能低下、备份时间长、数据变化功能不足等缺点。为了快速处理不断增长的数据,提供更高的可用性和保障银行正常运行,中国银行配置了Network Appliance(NetApp)的Filer F820C。
中国银行OA系统是由两台IBM公司的RS/6000集群系统构成,作为数据库服务器,主机的操作系统是AIX 4.3.3。存储系统则采用了Network Appliance公司的F820C。网络交换机是采用了Cisco公司的两台4006。软件采用了Lotus Notes,存储系统容量是4T。
双机容错容灾方案
容错能力是银行业最基本的要求,OA系统直接关系到中行内部运作的及时畅通。每一分钟的数据停顿可能会导致一些关键任务无法得到及时执行,从而影响其他业务的后续执行。为了保证OA系统高可用性的要求,该行选择了Network Appliance公司Active-Active双机容错模型构建的容灾解决方案,平时提供负载均衡,发生故障时则能起到接管故障机,以保障数据访问服务不被中断。方案里采用双机容错式(Cluster)的存储组成高可靠、高可用的数据存储平台,每个机头通过网络捆绑技术把两块网卡设置为主备用方式,拥有同一个IP地址,并交叉连接到两台网络交换机上;前端的主机采用相应的集群软件,设置成集群容错模型,并分别连接到两台交换机上。当存储发生硬盘故障,系统有RAID进行保护;当存储系统的机头发生故障,另一个机头会接管故障机头的所有设备,保证数据能够继续服务;当网络链路发生中断,交换机会负责寻找迂回路由;当前端主机发生故障,则由另一台主机接管故障主机的业务,充分保证主机、网络、存储三个层面上的高可用性。使用NetApp Filer 比使用直联式存储效率高。通过快速以太网,可以提供200个用户同时连接到Filer,同时打开200 MB到300MB范围内的文件。
备份方案
中国银行使用NetApp Filer的SnapShot 功能加速了在线备份、性能调整、空间再分配和卷拷贝。SnapShot是NetApp Filer Data ONTAP操作系统的一个独特功能,可以保存多达31个只读数据的备份,它可以重新找回被删除的文件,或快速恢复到任意一个SnapShot状态。使用SnapShot,管理员可以用很小的空间实现在线全盘备份,可以在线恢复丢失或被删除的文件,无需帮助或从磁带恢复。在线快速备份和恢复是指系统利用现有的磁盘空间来进行备份,由于使用的是处于工作状态的磁盘,而不是速度较慢的磁带,故备份和恢复的速度非常快,并且方便灵活。利用存储设备的SnapRestore,可以大规模地恢复数据。此功能对于在系统遭受病毒感染、系统数据全盘误删除、升级软件、测试软件等情况尤为有用。通过网络,采用其内置的异地镜像软件SnapMirror,可以对远程系统进行增量数据备份,利用SnapMirror构建的远程容灾方案来应对可能发生的自然灾难(火灾、水灾等)、战争或系统永久性毁坏。NetApp的存储产品还具备2分钟重启的功能。不仅大大减少了管理维护的宕机影响时间,同时还保证即便在灾难掉电的情况下,系统亦可以迅速恢复文件服务。完整的备份方案还应该包含离线海量备份和恢复的部分。存储设备支持直接连接磁带机和通过第三方软件来控制和管理磁带库。
NetApp Filer的高可用性、高可靠性和优越性能得到了中国银行的认可。正是因为其卓越的性能表现,中国银行计划扩大它的任务,用于其它的数据服务。
交通银行数据备份系统应用
交通银行在全国86个大中城市的分支行都已开通了储蓄通存通兑,其中66个城市的分支行推广应用了将本外币、全储种同城通存通兑系统和太平洋卡处理系统融为一体,具有“一卡通”功能的新型零售业务处理系统。交通银行业务规模不断扩大,该行业务系统的数据量逐年增加,对系统稳定性和数据的可用性提出了新的要求。如何保障系统数据的安全,保障银行业务系统的正常运行越来越重要,该行对数据可用性提出了严格的要求。
数据保护系统
该行原来采用了一些技术保障系统防止单机故障,但如何在系统数据丢失和需要恢复时快速有效地恢复原有数据仍是交通银行特别重视的一方面。该行OA系统应当是一个覆盖较大区域、所有操作系统平台、各种数据库系统的统一的备份解决方案,并且满足实时的备份要求、远程的数据保护及快速的系统恢复等,普通的备份软件已远远不能适应需求。
该行总行首先考虑了总行信息系统的数据保护,对信息系统进行了重新规划和更新,新的系统部分采用了SAN存储结构。对于数据量大的部分采用IBM小型机,备份时考虑LAN-Free方式,采用其它服务器(Sun、Sco、NT、NetWare等)。对于备份的要求,主要分为三个部分:SAN结构中的数据库部分(主要是IBM S85上的Sybase数据库、要求在线、自动化数据备份)、LAN结构中的数据库部分(主要是LAN结构中SunE5500、IBM M85、M80等服务器上的Sybase和Domino数据库、要求在线、自动化数据备份)、LAN结构中的文件服务器部分(SCO Unix、NT文件系统,NAS服务器上的数据,大量数据文件、要求在线、自动化数据备份)。
备份管理
在整个数据保护系统中,该行总行采用了集中统一的备份策略管理,通过NetBackup SAN Master Server,对整个数据库和文件系统的备份工作进行集中的管理、监控。用IBM S85服务器作为SAN Master Server,负责整个备份系统的管理,包括备份策略的制订、备份数据库的保存。该服务器同时也是一个NetBackup SAN Media Server服务器,负责将本机的数据或客户端的数据备份到磁带库中。NetBackup SAN Media server安装在SAN结构中其它需要备份的服务器上,负责备份本地数据。NetBackup client安装在其它网络服务器上,负责将各自服务器上的数据通过网络送给主服务器备份。每台Sybase服务器还安装Sybase agent, 负责NetBackup与Sybase Backup Server的集成,完成Sybase数据库的在线热备份。每台Domino服务器还安装Domino agent, 负责NetBackup与Notes Backup/Restore API的集成,完成Domino数据库的在线热备份。该行总行的NAS设备采用了IBM的开放式NAS,其NAS服务器是由PC服务器和存储设备组成,因此直接在该NAS设备上安装NetBac- kup Client for NT/2000,而不通过NDMP进行(通过NDMP,需要有磁带机直接与NAS服务器连接)。实施了VERITAS BMR智能灾难恢复,当某服务器出现系统故障时(例如引导盘失效),可以不重新安装操作系统,快速进行系统恢复。一个大容量的STK磁带库,4个Driver,直接连接到光纤交换机。
中国交通银行总行信息系统备份项目的实施,为保护交行信息系统数据提供了保障。由于采用灵活的备份策略和统一的管理,管理员每天只需通过监控界面对备份任务进行监控,就可以对备份作业的执行情况了如指掌。由于采用了多个驱动器同时进行数据备份,每晚的备份作业可以在1个小时内全部完成。交行总行电脑部的技术人员介绍说:“VERITAS的备份软件在自动管理、系统保护等功能上比以前的类似软件有很大的提高,为我们的信息系统数据保护提供了很好的帮助,大大降低了系统的风险程度及人力资源成本。”
中行甘肃分行的数据整合
中国银行甘肃分行是中国西部主要的商业银行之一,配合中央西部大开发战略,中国银行甘肃分行加大了电子化建设步伐,原有的系统基本上是以城市为基础来建立电子系统和存储处理中心,在整个甘肃省有近十个处理中心。这些系统对中行甘肃分行的业务发展曾起到非常重要的作用,但由于处理中心规模各异,机型也比较复杂,处理能力和存储能力也相差比较大,导致了在管理大容量数据时,增加运行难度以及维护成本,同时也不利于业务的发展。由于各中心分别处理业务数据,各地市级行甚至无法形成一本完整的账,从而影响到省分行到总行就更不可能有一本完整的账。在一个商业银行内部,由于信息处理中心数量多,分布面广,必然导致各中心的功能差异很大、运行效率低下。同时,由于每个中心都要有一套生产系统,一套备份系统,重复投资、重复建设的矛盾十分突出,加上管理不善,浪费现象也十分严重,不利于全行集约化经营。
在数据分散处理的情况下,信息处理中心数量多、分布广,给经营管理带来许多难题:第一,各个中心掌握设备的购买权,各自都根据自己的需要和喜好购买设备,造成硬件和网络设备型号不统一;第二,各分行纷纷根据自己的需要开发自己的应用软件,致使应用软件版本五花八门,即使是总行统一下发的软件,往往也被改得面目全非,软件的不统一最终造成了业务做法的不一致;第三,由于中心多,数据分散,随着业务量的加大,风险越来越大,各类案件不断增多,加大了管理难度。每个中心各有自己的生产系统,自己的数据备份系统,重复投资比较严重;而且不同厂家,不同类型机器需要分别升级,可扩充的能力又各不相同,费用极高,不利于投资的保护。
存储整合解决方案
基于网络环境中存在的问题,中行甘肃分行选择了HP的XP512设备作为存储整合的中心设备,将分行现有的主机系统和新购置的HP-UX连接起来。HP XP512的数据带宽和容量充分满足了集中后的业务处理和存储的需要。
该系统一改过去以服务器为中心的存储模式,而是以数据存储为中心,采用伸缩的存储网络拓扑结构,通过具有高传输速度的光纤通道( 每条100MB/s)直接连接,提供了存储局域网(SAN)内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储局域网内,腾出空间,让网络可以处理关键性任务。多台服务器共享一个超大容量、高可靠的存储设备,因此主机通过光纤通道可以与存储设备建立任意两点之间的连接, 从而能形成一个被多个服务器通过多条路径访问的共享存储池,保证了更高的可用性。分布式服务器可以访问一个大的集中管理的存储子系统,各种应用共享数据。由于存储结构采用光纤通道连接方式,可以保证存储的高扩展性和主机系统平滑地扩容。
应用效果
使用单个超大容量、高可靠的存储设备,通过一个简单的Web管理工具(集成在OpenView软件)从一个中心控制平台对存储进行管理,从根本上改变了各市地级分行在业务处理上各自为政、分散经营的小生产格局,实现了集中式的统一管理。集中后可以接触数据的人员也相对比较集中,数量较少,使电脑犯罪的可能性极大降低;同时便于对数据进行集中的备份,提高了数据的安全性和可靠性,也保证了数据的完整性和真实性。数据集中后,当天便能生成各种相关报表,保证决策支持系统数据采集的及时有效,提供了中行的竞争能力,也减轻了统计业务人员的工作量。HP XP512具有良好的可扩展性,业务发展后,数据量增大,也不用频繁更新存储设备。同时,在将来的投资中,还可以考虑在异地建立一个容灾中心,HP XP512也可以很好的满足此类需要,不用重新更换设备。通过数据的存储整合,中国银行甘肃分行得以从繁重的存储任务中解脱出来,可以专注于其核心业务的发展。
日立数据系统有限公司专家建议
鉴于我国银行业务处理系统众多、资金有限等特点,灾难恢复系统的建立应分为以下三个步骤:
第一步:银行应完成对业务系统的整合,特别是对信息的整合,以便降低运营成本和维护难度,从而有效地降低灾难恢复系统的难度和成本。
第二步:银行应为关键业务数据提供实时备份。一个完备的灾难恢复系统的建立包括主机备份、网络备份和数据备份三个部分,其中数据备份是最关键的组成部分,它直接关系到灾难后数据的恢复。因此,为关键业务数据提供更可靠的保护是十分必要的。
第三步:银行应为关键业务建立灾难恢复系统。
灾难恢复系统的建立是一项较复杂的项目,投资较大。因此需要全面考虑,总的原则是以提高整个业务系统的业务连续性为准而非只是灾难恢复。主要考虑:开放性、标准化性、存储系统的性能工作能力、数据的一致性完整性和逻辑性、设计实施的简易性、产品的成熟性、先进性(是否面向SAN或NAS设计)、实施成本等。此外,还应制定一系列的管理制度以确保灾难恢复的实施。其中包括:灾难报告制度、灾难恢复审批流程、灾难恢复操作规程、灾难恢复培训制度、灾难恢复演习制度等。