论文部分内容阅读
摘要:介绍了驰顺短信平台高可用性解决方案
关键字:小型机AIXOracleHACMP
引言
本方案依据对“驰顺短信服务平台”应用系统大致结构的描述,以及对数据存储/保护系统需求的意向作出。在设计中,遵循如下设计思想:在满足贵方数据存储/保护管理需求的前提下,使系统具有易于管理、可靠、高效率的特性,且综合投入合理,系统易于扩展及升级。
现代企业的应用和数据都储存在计算机中 ,由计算机来处理 ,一旦计算机系统发生意外故障 ,而引起应用停止甚至重要数据丢失 ,必将造成巨大损失 ,因此企业对系统运行要求高可用性和高可靠性。企业的成功与其支持全天候运营的能力成正比。意外的停机将影响到数据检索和其它的业务流程,这意味着效益损失,并造成客户的不满意。服务器是短信服务平台的核心,它在短信系统安全运行中起着主导作用,确保服务器的稳定、可靠、高效地运行是保障驰顺业务连续性的关键。因此,从驰顺的实际应用需求出发, 建立高稳定性和可靠性的服务器集群已成为驰顺信息系统建设中至关重要的环节。
项目背景
2.1、用户系统环境说明
系统采用两台IBM 9110-51A小型机,AIX5.3系统下运行Oracle10g数据库,数据存储在本地硬盘。
客户面临的挑战及需求
目前实际是单机运行,存在单点故障,当机器出现故障时不能切换到另外一台主机。且现有系统安装全部使用默认配置,没有作任何优化。数据靠应用程序来进行备份,Oracel数据库出现故障时不能完全恢复,数据库存在安全隐患,从现有业务系统运行情况来看,监控到业务高峰时系统是相当忙。客户希望新的方案能够提供高可用性及通过优化系统性能来提高信息的效率、安全性,以节省运营成本,提升企业竞争力。
解决方案
3.1、高可用解决方案
本方案的高可靠性设计可以保护用户的业务安全高效地运
行。IBM 9110-51A系列通过 AIX 操作系统的支持 ,利用 HACMP 实现了多种功能的高可用群集多处理方案,为高可用性计算提供了一个完美的解决方案
3.1.1、为什么需要HACMP
各厂商现有的 UNIX 服务器一般都拥有很高的可靠性,在这一点上 IBM 的 P 系列服务器表现尤为突出。但所有 UNIX 服务器均无法达到如 IBM 大型主机 S/390 那样的可靠性级别,这是开放平台服务器的体系结构和应用环境所决定的。使用 IBM 高可用性集群软件—— HACMP ,可以更好的保护关键业务应用不受故障影响。
3.1.2、HACMP工作原理
HACMP 是 High Availability Cluster Multi-Processing 的缩写。HACMP是IBM公司在P系列AIX操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所 提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作, 若是主机故障还切换至备份机上继续应用系统的运行。
作为双机系统的两台服务器同时运行 HACMP 软件;
两台服务器的备份方式有三种 :
一台服务器运行应用,另外一台服务器做为备份
两台服务器除正常运行本机的应用外,同时又作为对方的备份主机;
两台服务器同时运行相同的应用,需要数据库的支持。
两台主机系统在整个运行过程中,通过 “心跳线”相互监测对方的运行情况 (包括系统的软硬件运行、网络通讯和应用运行情况等);
一旦发现对方主机的运行不正常 (出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的 IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;
应用和资源的接管过程由 HACMP 软件自动完成,无需人工干预。
当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机 (备份机)上运行。
3.1.3、IBM 9110-51A HACMP数据中心建议方案
采用现有2 台IBM 9110-51A 服务器运行应用,分别运行 HACMP 软件,保证系统的高可靠性,构成了强大的小型数据中心。
采用光纤交换机建立存储局域网环境,分别连接两台 IBM 9110-51A 服务器和磁盘阵列。使用光纤交换机便于企业未来业务扩展。
采用 IBM DS4700 保证数据存储的可靠性和读取效率。
2 台 IBM 9110-51A 分别通过光纤连接到存储光纤交换机, DS4700 通过 2 根光纤连接到存储光纤交换机,如此连接即保证了可靠性,又提高了数据访问的效率。
方案拓扑图
服务器: IBM 9110-51A2 台
2 颗 2.1GHz 的 power5+ 处理器, 4GB 内存
2 块 73GB 内置硬盘 : 用于安装操作系统
2 块以太网卡
典型的,一个服务器应至少提供两块网卡 ( 一个服务网卡和一个备份网卡 ) 。服务网卡是服务器和网络之间的主连接。备份网卡用于备份服务网卡,当本地的服务网卡失效时, HACMP 软件将就备份用网络地址和服务用网络地址进行交换。如果另一个服务器失效时,备份用网卡将恢复失效节点的服务网络适配器的 IP 地址。
1块光纤卡
与光纤交换机相连,提高可靠性。
1 块 2 口异步卡
提供串口,连接心跳线。提供在两个节点间的点到点的连接,用于在 TCP/IP 子网失效事件发生时控制信息和心跳信息的传递。
HACMP 软件
AIX 操作系统
光纤交换机 IBM Total Storage SAN Switch 2005-H08
1台 8 口光纤交换机,用于连接服务器和磁盘阵列。 使用光纤交换机提高整个系统的可扩展性。
磁盘阵列 IBM Total Storage DS4700
用于存储用户数据。磁盘阵列与光纤交换机相连,提高可靠性和访问效率。
3.1.4 IBM 9110-51A HACMP经济型建议方案
采用 2 台 IBM 9110-51A 服务器运行应用,分别运行 HACMP 软件,保证系统的高可靠性。
采用光纤直连架构,不仅具有非常高的I/O性能,而且有效的节省客户的硬件投入。
采用 IBM DS4700 保证数据存储的可靠性和读取效率。
2 台 IBM 9110-51A 分别通过光纤直接连到IBM DS4700存储
方案拓扑图
服务器 : IBM 9110-51A2 台
2 颗 2.1GHz的 power5+ 处理器, 4GB 内存
2 块 73GB 内置硬盘 : 用于安装操作系统
1 块以太网卡
典型的,一个服务器应至少提供两块网卡,(一个服务网卡和一个备份网卡)。配置一块以太网卡。另外一块网卡利用内置的以太网卡。
1 块光纤卡
与光纤交换机相连。
1 块 2 口异步卡
提供串口,连接心跳线。提供在两个节点间的点到点的连接,用于在 TCP/IP 子网失效事件发生时控制信息和心跳信息的传递。
HACMP 软件
AIX 操作系统
磁盘阵列 IBM Total Storage DS4700
用于存储用户数据,磁盘阵列与IBM主机相连,提高可靠性和访问效率。
3.2、系统性能优化
A、操作系统LV镜像,提高系统的可靠性
B、存储优化,针对Oracle数据库应用作科学规划
C、对服务器系统进行调优,提升系统处理并发能力
D、对Oracle数据库进行调优,使用裸设备或ASM自动存储管理,提高系统IO性能
E、对短信应用相关SQL进行调优,表、索引优化
3.3、对数据进行备份
A、实现Oracle数据库自动备份,提高数据安全性
B、优化备份策略
C、改變非归档方式为为归档方式,建立RMAN数据库,通过RMAN实现完全或不完全的数据库恢复,优化备份策略
【参考文献】
1、《组建可扩展的CISCO互连网络(BSCI)》作者:Diane Teare
Catherine Paquet
译者:陈宇 袁国忠人民邮电出版社出版社
出版日期:2007年10月第一版
2、《TCP/IP详解》作者:W.Richard Stevens
译者:范建华张涛机械工业出版社
出版日期:2004年4月
注:文章内所有公式及图表请以PDF形式查看。
关键字:小型机AIXOracleHACMP
引言
本方案依据对“驰顺短信服务平台”应用系统大致结构的描述,以及对数据存储/保护系统需求的意向作出。在设计中,遵循如下设计思想:在满足贵方数据存储/保护管理需求的前提下,使系统具有易于管理、可靠、高效率的特性,且综合投入合理,系统易于扩展及升级。
现代企业的应用和数据都储存在计算机中 ,由计算机来处理 ,一旦计算机系统发生意外故障 ,而引起应用停止甚至重要数据丢失 ,必将造成巨大损失 ,因此企业对系统运行要求高可用性和高可靠性。企业的成功与其支持全天候运营的能力成正比。意外的停机将影响到数据检索和其它的业务流程,这意味着效益损失,并造成客户的不满意。服务器是短信服务平台的核心,它在短信系统安全运行中起着主导作用,确保服务器的稳定、可靠、高效地运行是保障驰顺业务连续性的关键。因此,从驰顺的实际应用需求出发, 建立高稳定性和可靠性的服务器集群已成为驰顺信息系统建设中至关重要的环节。
项目背景
2.1、用户系统环境说明
系统采用两台IBM 9110-51A小型机,AIX5.3系统下运行Oracle10g数据库,数据存储在本地硬盘。
客户面临的挑战及需求
目前实际是单机运行,存在单点故障,当机器出现故障时不能切换到另外一台主机。且现有系统安装全部使用默认配置,没有作任何优化。数据靠应用程序来进行备份,Oracel数据库出现故障时不能完全恢复,数据库存在安全隐患,从现有业务系统运行情况来看,监控到业务高峰时系统是相当忙。客户希望新的方案能够提供高可用性及通过优化系统性能来提高信息的效率、安全性,以节省运营成本,提升企业竞争力。
解决方案
3.1、高可用解决方案
本方案的高可靠性设计可以保护用户的业务安全高效地运
行。IBM 9110-51A系列通过 AIX 操作系统的支持 ,利用 HACMP 实现了多种功能的高可用群集多处理方案,为高可用性计算提供了一个完美的解决方案
3.1.1、为什么需要HACMP
各厂商现有的 UNIX 服务器一般都拥有很高的可靠性,在这一点上 IBM 的 P 系列服务器表现尤为突出。但所有 UNIX 服务器均无法达到如 IBM 大型主机 S/390 那样的可靠性级别,这是开放平台服务器的体系结构和应用环境所决定的。使用 IBM 高可用性集群软件—— HACMP ,可以更好的保护关键业务应用不受故障影响。
3.1.2、HACMP工作原理
HACMP 是 High Availability Cluster Multi-Processing 的缩写。HACMP是IBM公司在P系列AIX操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所 提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作, 若是主机故障还切换至备份机上继续应用系统的运行。
作为双机系统的两台服务器同时运行 HACMP 软件;
两台服务器的备份方式有三种 :
一台服务器运行应用,另外一台服务器做为备份
两台服务器除正常运行本机的应用外,同时又作为对方的备份主机;
两台服务器同时运行相同的应用,需要数据库的支持。
两台主机系统在整个运行过程中,通过 “心跳线”相互监测对方的运行情况 (包括系统的软硬件运行、网络通讯和应用运行情况等);
一旦发现对方主机的运行不正常 (出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的 IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;
应用和资源的接管过程由 HACMP 软件自动完成,无需人工干预。
当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机 (备份机)上运行。
3.1.3、IBM 9110-51A HACMP数据中心建议方案
采用现有2 台IBM 9110-51A 服务器运行应用,分别运行 HACMP 软件,保证系统的高可靠性,构成了强大的小型数据中心。
采用光纤交换机建立存储局域网环境,分别连接两台 IBM 9110-51A 服务器和磁盘阵列。使用光纤交换机便于企业未来业务扩展。
采用 IBM DS4700 保证数据存储的可靠性和读取效率。
2 台 IBM 9110-51A 分别通过光纤连接到存储光纤交换机, DS4700 通过 2 根光纤连接到存储光纤交换机,如此连接即保证了可靠性,又提高了数据访问的效率。
方案拓扑图
服务器: IBM 9110-51A2 台
2 颗 2.1GHz 的 power5+ 处理器, 4GB 内存
2 块 73GB 内置硬盘 : 用于安装操作系统
2 块以太网卡
典型的,一个服务器应至少提供两块网卡 ( 一个服务网卡和一个备份网卡 ) 。服务网卡是服务器和网络之间的主连接。备份网卡用于备份服务网卡,当本地的服务网卡失效时, HACMP 软件将就备份用网络地址和服务用网络地址进行交换。如果另一个服务器失效时,备份用网卡将恢复失效节点的服务网络适配器的 IP 地址。
1块光纤卡
与光纤交换机相连,提高可靠性。
1 块 2 口异步卡
提供串口,连接心跳线。提供在两个节点间的点到点的连接,用于在 TCP/IP 子网失效事件发生时控制信息和心跳信息的传递。
HACMP 软件
AIX 操作系统
光纤交换机 IBM Total Storage SAN Switch 2005-H08
1台 8 口光纤交换机,用于连接服务器和磁盘阵列。 使用光纤交换机提高整个系统的可扩展性。
磁盘阵列 IBM Total Storage DS4700
用于存储用户数据。磁盘阵列与光纤交换机相连,提高可靠性和访问效率。
3.1.4 IBM 9110-51A HACMP经济型建议方案
采用 2 台 IBM 9110-51A 服务器运行应用,分别运行 HACMP 软件,保证系统的高可靠性。
采用光纤直连架构,不仅具有非常高的I/O性能,而且有效的节省客户的硬件投入。
采用 IBM DS4700 保证数据存储的可靠性和读取效率。
2 台 IBM 9110-51A 分别通过光纤直接连到IBM DS4700存储
方案拓扑图
服务器 : IBM 9110-51A2 台
2 颗 2.1GHz的 power5+ 处理器, 4GB 内存
2 块 73GB 内置硬盘 : 用于安装操作系统
1 块以太网卡
典型的,一个服务器应至少提供两块网卡,(一个服务网卡和一个备份网卡)。配置一块以太网卡。另外一块网卡利用内置的以太网卡。
1 块光纤卡
与光纤交换机相连。
1 块 2 口异步卡
提供串口,连接心跳线。提供在两个节点间的点到点的连接,用于在 TCP/IP 子网失效事件发生时控制信息和心跳信息的传递。
HACMP 软件
AIX 操作系统
磁盘阵列 IBM Total Storage DS4700
用于存储用户数据,磁盘阵列与IBM主机相连,提高可靠性和访问效率。
3.2、系统性能优化
A、操作系统LV镜像,提高系统的可靠性
B、存储优化,针对Oracle数据库应用作科学规划
C、对服务器系统进行调优,提升系统处理并发能力
D、对Oracle数据库进行调优,使用裸设备或ASM自动存储管理,提高系统IO性能
E、对短信应用相关SQL进行调优,表、索引优化
3.3、对数据进行备份
A、实现Oracle数据库自动备份,提高数据安全性
B、优化备份策略
C、改變非归档方式为为归档方式,建立RMAN数据库,通过RMAN实现完全或不完全的数据库恢复,优化备份策略
【参考文献】
1、《组建可扩展的CISCO互连网络(BSCI)》作者:Diane Teare
Catherine Paquet
译者:陈宇 袁国忠人民邮电出版社出版社
出版日期:2007年10月第一版
2、《TCP/IP详解》作者:W.Richard Stevens
译者:范建华张涛机械工业出版社
出版日期:2004年4月
注:文章内所有公式及图表请以PDF形式查看。