论文部分内容阅读
【摘要】信息高速发展的时代,企业对计算机系统的依赖程度日渐增加。为保证数据的安全性和可靠性,在计算机系统中采用可靠的数据备份和恢复措施是当务之急。本文就双机热备系统的工作原理及技术方案进行探讨,以实现网络数据的安全性和可靠性。
【关键词】双机热备系统 单工模式 心跳信号 磁盘阵列
信息高速发展的时代,企业对计算机系统的依赖程度日渐增加,系统内存储着重要的信息和数据,一旦数据丢失将造成无法弥补的损失。为了保证系统中数据的安全性和可靠性,当计算机网络系统出现故障时,网络中的核心数据必须能安全保存和迅速恢复,因此,在计算机网络中采用可靠的数据备份和恢复措施是非常必要的。
一、数据备份与恢复概述
在计算机网络中,最珍贵的财产是计算机内的数据。建立网络的初衷是方便地传递与使用数据,但人为错误、硬盘损坏、电脑病毒、断电或天灾人祸等随时可能造成数据丢失。数据备份与恢复是指将计算机硬盘上的原始数据复制到其它存储媒体上,在出现数据丢失或系统灾难时将复制在其它存储媒体上的数据恢复到硬盘上,从而保护计算机的系统数据和应用数据。目前几乎每个大型网络都有数据备份和恢复措施,而这些措施确实在不少灾难性的数据丢失事件中发挥了重要作用。
二、数据备份与恢复的原则
对数据进行备份是为保证数据的安全性,不同系统要求不同的解决方案,但总体应满足以下原则:
1、安全性和稳定性
备份产品的主要作用是为系统提供一个数据保护的方法,该产品在对数据进行备份时,要具有检查、预防和杀病毒的功能,确保无毒备份,同时还要保证备份介质不丢失和备份数据的完整性。
2、实时高效性
随着业务不断发展,使得数据多更新快,数据备份间隔越来越短,备份需要的时间也越来越长,一定要提高备份的速度。有些关键性任务要保证24小时不停机运转,进行备份时,要实时查看文件大小,进行事务跟踪,保证正确备份系统中的所有文件。
3、具有自动化和容错性
备份方案应提供定时的自动备份功能,可利用磁带库技术进行自动换带和日志记录功能,并在出现异常时自动报警等。也可引入RAID技术,对磁带进行镜像,以保证数据安全可靠。
三、数据备份与恢复方法的实现
随着网络技术的发展,网络备份技术已应用到数据的存储和备份中。双机热备系统提供在线数据保护,可以自动进行本地和异地备份,可避免人为错误、磁盘损坏、病毒攻击、操作系统崩溃等给数据带来的损失,保证遇到各种灾害时数据的安全,能够实现真正的远程容灾保护。下面应用双机热备系统对数据备份与恢复方法进行进一步的研究与探讨。
1、系统需求
根据用户的应用要求,数据库双机热备系统配置为:
>系统基于RefflagLinuxDC5.0平台,数据库平台采用DM5.0;
>服务器双机热备为单工模式。一台服务器运行DM数据库系统,另一台服务器为备机,两台机器相互检测对方的运行状态。当一台主机停机时,另一台主机立即接管其工作,保证工作不间断;
>数据集中在磁盘阵列柜,磁盘柜使用RAID5技术;
>双机容错软件选用DataWare双机容错系统,该系统是能提供防止业务主机因不可避免的意外性或计划性停机问题的高可用性软件;
>服务器与客户端遵循TCP/IP协议,对用户而言切换是透明的。
2、工作原理及过程
DataWare软件同时安装在两台主机上,用来监视系统状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软硬件发生的故障,及时进行错误的隔离和恢复,以最低成本提供给用户不停顿的计算机作业环境。在正常运作情形下,主机间透过侦测机制相互侦测。当一主机有错误产生时,DataWare提供严谨的判断与分析,确认主机出错后,才完全启动备援接管动作。
容错软件在服务器节点间保持间歇的通信信号(心跳信号),是错误检测的一个机制。该机制通过每一个通信路径,在两个对等系统间进行周期性握手,如果连续没有收到的心跳信号达到一定数目,DataWare容错软件就把这条路径用红色表示为失效。一般情况下DataWare容错软件为了避免不必要的失效切换,通常建立两条独立的心跳检测路径,即至少使用两种心跳检测方法保证万无一失:
>在共享磁盘阵列上开辟一个裸设备区(>10M),两台机器上运行的DataWare软件负责按照一定时间周期,向这个共享裸设备区写入自身的运行状态,并读取对方机器的运行状态,以达到相互检测的目的;
>TCP/IPSocketPrivateNet,即两台服务器的网卡通过LAN建立一条通讯路径。如果共享磁盘阵列裸设备区检测模式失效,服务器仍然可以以公用网侦测对方服务器的可用性。如果对方服务器仍然可用,则不触发接管动作,否则立即通过启动文件系统、数据库和网络虚拟地址等实施接管动作。
下面讨论DataWare容错备援运作过程:
>自动侦测阶段。主机上的软件通过侦测机制,经由复杂的监听程序和逻辑判断来相互侦测对方运行的情况;
>自动切换阶段。某一主机如果确认对方故障,则正常主机除继续进行原来的任务,还将依据各种容错备援模式接管预先设定的备援作业程序,并进行后继的数据库服务;
>自动恢复阶段。在正常主机代替故障主机工作后,故障主机可离线进行修复工作。当故障主机修复后,通过通讯检测机制与原正常主机连接,切换回修复完成的主机上。整个恢复过程需要技术人员利用DataWare软件提供的命令进行切换。
双机热备系统选用DataWare单工工作模式。双服务器通过一条TCP/IP网线连接到LAN,双服务器各自通过一条SCSI电缆线与RAID磁盘阵列相连,一台服务器作为主机运行DM数据库服务器,另一台作为备机。当服务器1故障后,服务器2自动接管服务器1的运行。这时服务器1的作业将在服务器2上自动运行,当服务器1修复后,服务器2将把服务器1的作业手动交还服务器1。
3、实施方案
在双机热备系统中,两台主机的硬件配置可以不同,但操作系统、应用软件、容错软件应相对应,具体实现过程如下:
>对磁盘阵列柜做RAID5。分区后分别挂在不同主机上,这样可克服系统硬件的故障;
>安装操作系统Linux、DM数据库。操作系统和DM数据库的系统文件安装在主机各自的硬盘上,DM数据库的数据文件存放在磁盘阵列柜上,必须在两台主机上保存相同的DM数据库的初始化文件;
>安装DataWare容错软件。DataWare软件必须在两台主机上各装一套,每台主机上有公网的固定地址和有双机
软件控制的飘移地址(虚拟IP地址)。在客户端的应用中,应用程序要使用飘移地址,该地址和系统的应用实例,即DM数据库应用实例是锁定的。当主机1因故障停机时,它的数据库应用就有主机2接管,同时它的飘移地址也被主机2接管。从而有效保证网络数据的安全性和可靠性。
参考文献
[1] 任君.嵌入式系统开发与实践[M].北京:中国北京航空航天大学出版社,2010.
[2] 何东宇,张扬.基于DM数据库服务器的典型应用[M].北京:中国铁道出版社,2011.
【关键词】双机热备系统 单工模式 心跳信号 磁盘阵列
信息高速发展的时代,企业对计算机系统的依赖程度日渐增加,系统内存储着重要的信息和数据,一旦数据丢失将造成无法弥补的损失。为了保证系统中数据的安全性和可靠性,当计算机网络系统出现故障时,网络中的核心数据必须能安全保存和迅速恢复,因此,在计算机网络中采用可靠的数据备份和恢复措施是非常必要的。
一、数据备份与恢复概述
在计算机网络中,最珍贵的财产是计算机内的数据。建立网络的初衷是方便地传递与使用数据,但人为错误、硬盘损坏、电脑病毒、断电或天灾人祸等随时可能造成数据丢失。数据备份与恢复是指将计算机硬盘上的原始数据复制到其它存储媒体上,在出现数据丢失或系统灾难时将复制在其它存储媒体上的数据恢复到硬盘上,从而保护计算机的系统数据和应用数据。目前几乎每个大型网络都有数据备份和恢复措施,而这些措施确实在不少灾难性的数据丢失事件中发挥了重要作用。
二、数据备份与恢复的原则
对数据进行备份是为保证数据的安全性,不同系统要求不同的解决方案,但总体应满足以下原则:
1、安全性和稳定性
备份产品的主要作用是为系统提供一个数据保护的方法,该产品在对数据进行备份时,要具有检查、预防和杀病毒的功能,确保无毒备份,同时还要保证备份介质不丢失和备份数据的完整性。
2、实时高效性
随着业务不断发展,使得数据多更新快,数据备份间隔越来越短,备份需要的时间也越来越长,一定要提高备份的速度。有些关键性任务要保证24小时不停机运转,进行备份时,要实时查看文件大小,进行事务跟踪,保证正确备份系统中的所有文件。
3、具有自动化和容错性
备份方案应提供定时的自动备份功能,可利用磁带库技术进行自动换带和日志记录功能,并在出现异常时自动报警等。也可引入RAID技术,对磁带进行镜像,以保证数据安全可靠。
三、数据备份与恢复方法的实现
随着网络技术的发展,网络备份技术已应用到数据的存储和备份中。双机热备系统提供在线数据保护,可以自动进行本地和异地备份,可避免人为错误、磁盘损坏、病毒攻击、操作系统崩溃等给数据带来的损失,保证遇到各种灾害时数据的安全,能够实现真正的远程容灾保护。下面应用双机热备系统对数据备份与恢复方法进行进一步的研究与探讨。
1、系统需求
根据用户的应用要求,数据库双机热备系统配置为:
>系统基于RefflagLinuxDC5.0平台,数据库平台采用DM5.0;
>服务器双机热备为单工模式。一台服务器运行DM数据库系统,另一台服务器为备机,两台机器相互检测对方的运行状态。当一台主机停机时,另一台主机立即接管其工作,保证工作不间断;
>数据集中在磁盘阵列柜,磁盘柜使用RAID5技术;
>双机容错软件选用DataWare双机容错系统,该系统是能提供防止业务主机因不可避免的意外性或计划性停机问题的高可用性软件;
>服务器与客户端遵循TCP/IP协议,对用户而言切换是透明的。
2、工作原理及过程
DataWare软件同时安装在两台主机上,用来监视系统状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软硬件发生的故障,及时进行错误的隔离和恢复,以最低成本提供给用户不停顿的计算机作业环境。在正常运作情形下,主机间透过侦测机制相互侦测。当一主机有错误产生时,DataWare提供严谨的判断与分析,确认主机出错后,才完全启动备援接管动作。
容错软件在服务器节点间保持间歇的通信信号(心跳信号),是错误检测的一个机制。该机制通过每一个通信路径,在两个对等系统间进行周期性握手,如果连续没有收到的心跳信号达到一定数目,DataWare容错软件就把这条路径用红色表示为失效。一般情况下DataWare容错软件为了避免不必要的失效切换,通常建立两条独立的心跳检测路径,即至少使用两种心跳检测方法保证万无一失:
>在共享磁盘阵列上开辟一个裸设备区(>10M),两台机器上运行的DataWare软件负责按照一定时间周期,向这个共享裸设备区写入自身的运行状态,并读取对方机器的运行状态,以达到相互检测的目的;
>TCP/IPSocketPrivateNet,即两台服务器的网卡通过LAN建立一条通讯路径。如果共享磁盘阵列裸设备区检测模式失效,服务器仍然可以以公用网侦测对方服务器的可用性。如果对方服务器仍然可用,则不触发接管动作,否则立即通过启动文件系统、数据库和网络虚拟地址等实施接管动作。
下面讨论DataWare容错备援运作过程:
>自动侦测阶段。主机上的软件通过侦测机制,经由复杂的监听程序和逻辑判断来相互侦测对方运行的情况;
>自动切换阶段。某一主机如果确认对方故障,则正常主机除继续进行原来的任务,还将依据各种容错备援模式接管预先设定的备援作业程序,并进行后继的数据库服务;
>自动恢复阶段。在正常主机代替故障主机工作后,故障主机可离线进行修复工作。当故障主机修复后,通过通讯检测机制与原正常主机连接,切换回修复完成的主机上。整个恢复过程需要技术人员利用DataWare软件提供的命令进行切换。
双机热备系统选用DataWare单工工作模式。双服务器通过一条TCP/IP网线连接到LAN,双服务器各自通过一条SCSI电缆线与RAID磁盘阵列相连,一台服务器作为主机运行DM数据库服务器,另一台作为备机。当服务器1故障后,服务器2自动接管服务器1的运行。这时服务器1的作业将在服务器2上自动运行,当服务器1修复后,服务器2将把服务器1的作业手动交还服务器1。
3、实施方案
在双机热备系统中,两台主机的硬件配置可以不同,但操作系统、应用软件、容错软件应相对应,具体实现过程如下:
>对磁盘阵列柜做RAID5。分区后分别挂在不同主机上,这样可克服系统硬件的故障;
>安装操作系统Linux、DM数据库。操作系统和DM数据库的系统文件安装在主机各自的硬盘上,DM数据库的数据文件存放在磁盘阵列柜上,必须在两台主机上保存相同的DM数据库的初始化文件;
>安装DataWare容错软件。DataWare软件必须在两台主机上各装一套,每台主机上有公网的固定地址和有双机
软件控制的飘移地址(虚拟IP地址)。在客户端的应用中,应用程序要使用飘移地址,该地址和系统的应用实例,即DM数据库应用实例是锁定的。当主机1因故障停机时,它的数据库应用就有主机2接管,同时它的飘移地址也被主机2接管。从而有效保证网络数据的安全性和可靠性。
参考文献
[1] 任君.嵌入式系统开发与实践[M].北京:中国北京航空航天大学出版社,2010.
[2] 何东宇,张扬.基于DM数据库服务器的典型应用[M].北京:中国铁道出版社,2011.