论文部分内容阅读
[摘要]以华北电力大学图书馆为倒,对数字图书馆的各类数据资源进行了分析,从加强磁盘可靠性、组建双机热备系统、加装UPS不间断电源以及加强服务器的日常安全雏护等多方面考虑图书馆数据资源的安全防御问题,并对馆藏数据资源的数据备份方法做了介绍。
[关键词]图书馆;数据安全;数据备份
DOl:10.3969/j.issn.1008-0821.2010.06.039
[中图分类号]G250.76 [文献标识码]A [文章编号]1008—0821(2010)06—0133—03
数字图书馆是网络信息技术发展的结果,在数字图书馆中,已经不仅仅局限于原来的图书、期刊等纸质资源,电子期刊、电子图书、视频等电子文献资源日趋增多,编目、采访、流通等图书馆业务管理都实现了电子化、自动化、网络化,因此,图书馆的数据资源急剧增加,图书馆的自动化管理工作也日趋复杂。数据资源是数字图书馆的“心脏”,对图书馆有着至关重要的作用,数据资源的丢失和破坏,将对图书馆造成致命影响,因此,保护数据资源的安全是图书馆自动化管理工作的重中之重。
网络在给图书馆带来便利的同时,也给图书馆数据资源带来了很大的安全隐患,除了要保证机房良好的运行环境外,还应该从数据备份、磁盘可靠性、双机热备、电源保障及服务器的日常安全维护等多方面来考虑数据资源的安全问题。
下面将结合华北电力大学图书馆的实际情况对数据安全策略以及数据备份进行探讨。
1 数据资源分析
华北电力大学图书馆的数据资源主要分为三大类:
1.1 馆藏数据资源
馆藏数据资源主要包括该馆所收藏的图书、期刊等纸质文献的书目数据、书目数据所使用的相应规范、读者信息以及文献的流通信息等,这些数据是图书馆的核心数据,非常重要。馆藏数据资源的数据变化量非常大。一旦丢失或破坏,数据恢复的难度很大,因此,必须做好这些数据的备份工作。
1.2 电子文献资源
电子文献资源主要包括电子期刊、电子图书、学位论文、各种会议论文、网络视频数据库以及国内外各种网络数据库资源等。
电子文献资源可以分为以下几类:
1.2.1 通过网络远程访问的电子资源
通过网络远程访问的电子资源都有专门的数据库供应商,数据库安装在供应商的远程数据库服务器上,不需要图书馆本地安装和维护数据。
1.2.2 通过本地镜像方式访问的电子资源
本地镜像方式需要将数据库全部安装到图书馆本地服务器上,数据库一般都比较庞大,但是变化不太频繁,在需要时可以由数据库供应商来进行数据的恢复,不需要做本地备份。
1.2.3 通过分布式镜像方式访问的电子资源
分布式镜像方式是将数据库索引安装到本地服务器上,通过网络来获取原文数据。索引数据一般以月或者年度为单位进行更新,本地服务器上只需要备份索引库。
1.3 图书馆自建数据库资源
图书馆自建数据库资源主要包括学位论文提交服务系统数据库、图书馆无线上网系统数据库以及校外访问图书馆资源的VPN系统数据库等,对应系统都提供了相应的备份和恢复方法,备份及恢复都比较简单。
汇文系统作为图书馆的核心管理系统,需要全天候不间断运行,数据要求安全可靠,而且数据的读写操作频繁,因此所配备的磁盘阵列首先必须有很好的冗余性,其次是读写性能。如表1所示,RAIDl是冗余性最高的方式,可以作为首选,但是RAIDl的磁盘利用率很低仅为50%,可以通过增加磁盘的方式来满足系统对存储空间的需求,多组RAIDl镜像磁盘如果直接使用则需要建立多个磁盘挂载点,不便于数据的管理和维护,因此,本文在RAID1的基础上又将各镜像磁盘通过RAID0组成了一块大容量磁盘,从而形成了RAID1 0磁盘阵列。
RA/D1 0磁盘阵列虽然牺牲了一半的磁盘空间,但是充分保证了数据的安全,只有在同一组RAID1中的2块镜像磁盘同时损坏的情况下才会导致数据丢失,其安全性较RAID3和RAID5都要高,而且RAIDl 0不存在数据奇偶校 三类数据资源中以馆藏数据资源最复杂、变化最频繁,同时也是最重要的,因此,馆藏数据资源的安全与备份工作是图书馆自动化管理工作的重点。 华北电力大学图书馆的馆藏数据采用由江苏汇文软件有限公司研制开发的汇文文献信息服务系统(以下简称“汇文系统”)进行管理,本文将重点阐述汇文系统的软硬件安全保障方法和数据备份的实现方法。
2 软硬件保障
2.1 RAID技术
RAID(Redundant Array ofIndependent Disk)是一种由多块磁盘构成的冗余磁盘阵列,RAID可以充分发挥出多块磁盘的优势,加快磁盘读取速度,提高容错性能,使数据更加安全、可靠。
RAID有RAID0~RAID7等多个级别,它们的侧重点各不相同,最常用的是RAID0、ILMDI、RAID3和RAID5,如图1所示。
验因而数据读写(尤其是写)及数据恢复的速度都比RAIm和RAID5有了很大提高,充分满足了系统对数据安全性及数据读写性能的要求。
2.2 双机热备技术
RAID技术仅能从磁盘安全的角度保证数据的安全问题,而当服务器硬件或操作系统出现问题时,要保证汇文系统服务不被中断,则需要引入双机热备技术。汇文系统采用2台HP服务器组成双机热备系统,在系统运行正常时,1台服务器作为主机,另外1台服务器作为备机,2台服务器通过“心跳线”连结,当主服务器出现故障时,EMC AutoStart管理软件通过“心跳”信号监测到主机系统发生故障,并自动将服务转移到备用服务器,从而保证汇文系统不间断运行。
2.3 UPS不间断电源供电
机房的突然断电会导致服务器异常停止工作,不但会导致数据的丢失或损坏,而且会造成服务器和存储等硬件设备损坏,给图书馆带来数据资源的缺失和巨大的经济损失。
为此,该馆在机房内安装了2台山特20kVA的UPS不间断电源,在发生突然断电的情况下能继续供电2小时,如果断电时间比较长或者不可预知,可以选择关闭部分或者全部服务器及硬件设备,在恢复正常供电时再重新开启服务器及硬件设备,以保证数据及硬件设备的安全。
此外,为了保证uPS的安全可靠,还可以配备双机冗余UPS电源,条件允许的情况下还可以安装uPS监控软件,用来监视IIPS的运行状态,及时了解电池状况,以便采取预防措施,还可以设置在断电情况下安全关闭用户系统,以确保数据的安全。
2.4 服务器的日常安全维护
图书馆自动化工作人员需要在服务器上安装网络版杀毒软件、防火墙,定期检查服务器运行状况,及时修复系 统漏洞和进行杀毒软件升级,通过查杀病毒、查看系统日志提早发现问题,做到防患于未然。
3 汇文系统数据备份
3.1 数据库备份方法
华北电力大学图书馆汇文系统采用的是Oracle数据库,Oracle数据库的备份方法主要有3种:
(1)冷备份,冷备份的备份比较快,容易归档,容易恢复,但是该方法需要在关闭数据库的情况下才能进行,而图书馆的oracle数据库是7*24小时运行的,这不符合图书馆的实际情况。
(2)热备份即物理备份,可以在表空间或数据文件级备份,备份的时间短,并且备份不影响数据库使用,恢复速度快,但是该方法需要将数据库设置为归档模式,而且需要一个表空间一个表空间地备份,比较复杂,维护比较困难,不能出错,出错后后果严重。
(3)逻辑备份即导出/导入备份,该方法不需要数据库运行在归挡模式下,备份时数据库可正常运行,备份简单,备份及恢复的时间短。逻辑备份根据备份内容可以分为3种模式:
①用户备份:备份某个用户的所有对象以及对象中的数据,业务数据库通常采用这种模式;
②表备份:备份某个用户指定的对象(表);
③完全备份:对数据库所有对象进行备份,主要用于数据库的移植以及系统的备份。
该馆的oracle数据库采用逻辑备份的用户备份方式,手动操作的具体实现方法是:在“命令提示符”窗口输入exp,根据oracle提示进行导出备份,如图2所示。
3.2 汇文系统数据自动备份
汇文系统的数据库是7*24小时运行,因此,为避免进行备份操作时数据变化频繁,备份操作选择在数据操作比较少的深夜时进行,以期达到较好的备份效果,实现方法是将导出备份的命令做成批处理文件,并添加到系统的任务计划,让其在预定时间自动执行。
批处理文件内容如下:
exp userid=system/******@llbsy~file=f:\bak\
[关键词]图书馆;数据安全;数据备份
DOl:10.3969/j.issn.1008-0821.2010.06.039
[中图分类号]G250.76 [文献标识码]A [文章编号]1008—0821(2010)06—0133—03
数字图书馆是网络信息技术发展的结果,在数字图书馆中,已经不仅仅局限于原来的图书、期刊等纸质资源,电子期刊、电子图书、视频等电子文献资源日趋增多,编目、采访、流通等图书馆业务管理都实现了电子化、自动化、网络化,因此,图书馆的数据资源急剧增加,图书馆的自动化管理工作也日趋复杂。数据资源是数字图书馆的“心脏”,对图书馆有着至关重要的作用,数据资源的丢失和破坏,将对图书馆造成致命影响,因此,保护数据资源的安全是图书馆自动化管理工作的重中之重。
网络在给图书馆带来便利的同时,也给图书馆数据资源带来了很大的安全隐患,除了要保证机房良好的运行环境外,还应该从数据备份、磁盘可靠性、双机热备、电源保障及服务器的日常安全维护等多方面来考虑数据资源的安全问题。
下面将结合华北电力大学图书馆的实际情况对数据安全策略以及数据备份进行探讨。
1 数据资源分析
华北电力大学图书馆的数据资源主要分为三大类:
1.1 馆藏数据资源
馆藏数据资源主要包括该馆所收藏的图书、期刊等纸质文献的书目数据、书目数据所使用的相应规范、读者信息以及文献的流通信息等,这些数据是图书馆的核心数据,非常重要。馆藏数据资源的数据变化量非常大。一旦丢失或破坏,数据恢复的难度很大,因此,必须做好这些数据的备份工作。
1.2 电子文献资源
电子文献资源主要包括电子期刊、电子图书、学位论文、各种会议论文、网络视频数据库以及国内外各种网络数据库资源等。
电子文献资源可以分为以下几类:
1.2.1 通过网络远程访问的电子资源
通过网络远程访问的电子资源都有专门的数据库供应商,数据库安装在供应商的远程数据库服务器上,不需要图书馆本地安装和维护数据。
1.2.2 通过本地镜像方式访问的电子资源
本地镜像方式需要将数据库全部安装到图书馆本地服务器上,数据库一般都比较庞大,但是变化不太频繁,在需要时可以由数据库供应商来进行数据的恢复,不需要做本地备份。
1.2.3 通过分布式镜像方式访问的电子资源
分布式镜像方式是将数据库索引安装到本地服务器上,通过网络来获取原文数据。索引数据一般以月或者年度为单位进行更新,本地服务器上只需要备份索引库。
1.3 图书馆自建数据库资源
图书馆自建数据库资源主要包括学位论文提交服务系统数据库、图书馆无线上网系统数据库以及校外访问图书馆资源的VPN系统数据库等,对应系统都提供了相应的备份和恢复方法,备份及恢复都比较简单。
汇文系统作为图书馆的核心管理系统,需要全天候不间断运行,数据要求安全可靠,而且数据的读写操作频繁,因此所配备的磁盘阵列首先必须有很好的冗余性,其次是读写性能。如表1所示,RAIDl是冗余性最高的方式,可以作为首选,但是RAIDl的磁盘利用率很低仅为50%,可以通过增加磁盘的方式来满足系统对存储空间的需求,多组RAIDl镜像磁盘如果直接使用则需要建立多个磁盘挂载点,不便于数据的管理和维护,因此,本文在RAID1的基础上又将各镜像磁盘通过RAID0组成了一块大容量磁盘,从而形成了RAID1 0磁盘阵列。
RA/D1 0磁盘阵列虽然牺牲了一半的磁盘空间,但是充分保证了数据的安全,只有在同一组RAID1中的2块镜像磁盘同时损坏的情况下才会导致数据丢失,其安全性较RAID3和RAID5都要高,而且RAIDl 0不存在数据奇偶校 三类数据资源中以馆藏数据资源最复杂、变化最频繁,同时也是最重要的,因此,馆藏数据资源的安全与备份工作是图书馆自动化管理工作的重点。 华北电力大学图书馆的馆藏数据采用由江苏汇文软件有限公司研制开发的汇文文献信息服务系统(以下简称“汇文系统”)进行管理,本文将重点阐述汇文系统的软硬件安全保障方法和数据备份的实现方法。
2 软硬件保障
2.1 RAID技术
RAID(Redundant Array ofIndependent Disk)是一种由多块磁盘构成的冗余磁盘阵列,RAID可以充分发挥出多块磁盘的优势,加快磁盘读取速度,提高容错性能,使数据更加安全、可靠。
RAID有RAID0~RAID7等多个级别,它们的侧重点各不相同,最常用的是RAID0、ILMDI、RAID3和RAID5,如图1所示。
验因而数据读写(尤其是写)及数据恢复的速度都比RAIm和RAID5有了很大提高,充分满足了系统对数据安全性及数据读写性能的要求。
2.2 双机热备技术
RAID技术仅能从磁盘安全的角度保证数据的安全问题,而当服务器硬件或操作系统出现问题时,要保证汇文系统服务不被中断,则需要引入双机热备技术。汇文系统采用2台HP服务器组成双机热备系统,在系统运行正常时,1台服务器作为主机,另外1台服务器作为备机,2台服务器通过“心跳线”连结,当主服务器出现故障时,EMC AutoStart管理软件通过“心跳”信号监测到主机系统发生故障,并自动将服务转移到备用服务器,从而保证汇文系统不间断运行。
2.3 UPS不间断电源供电
机房的突然断电会导致服务器异常停止工作,不但会导致数据的丢失或损坏,而且会造成服务器和存储等硬件设备损坏,给图书馆带来数据资源的缺失和巨大的经济损失。
为此,该馆在机房内安装了2台山特20kVA的UPS不间断电源,在发生突然断电的情况下能继续供电2小时,如果断电时间比较长或者不可预知,可以选择关闭部分或者全部服务器及硬件设备,在恢复正常供电时再重新开启服务器及硬件设备,以保证数据及硬件设备的安全。
此外,为了保证uPS的安全可靠,还可以配备双机冗余UPS电源,条件允许的情况下还可以安装uPS监控软件,用来监视IIPS的运行状态,及时了解电池状况,以便采取预防措施,还可以设置在断电情况下安全关闭用户系统,以确保数据的安全。
2.4 服务器的日常安全维护
图书馆自动化工作人员需要在服务器上安装网络版杀毒软件、防火墙,定期检查服务器运行状况,及时修复系 统漏洞和进行杀毒软件升级,通过查杀病毒、查看系统日志提早发现问题,做到防患于未然。
3 汇文系统数据备份
3.1 数据库备份方法
华北电力大学图书馆汇文系统采用的是Oracle数据库,Oracle数据库的备份方法主要有3种:
(1)冷备份,冷备份的备份比较快,容易归档,容易恢复,但是该方法需要在关闭数据库的情况下才能进行,而图书馆的oracle数据库是7*24小时运行的,这不符合图书馆的实际情况。
(2)热备份即物理备份,可以在表空间或数据文件级备份,备份的时间短,并且备份不影响数据库使用,恢复速度快,但是该方法需要将数据库设置为归档模式,而且需要一个表空间一个表空间地备份,比较复杂,维护比较困难,不能出错,出错后后果严重。
(3)逻辑备份即导出/导入备份,该方法不需要数据库运行在归挡模式下,备份时数据库可正常运行,备份简单,备份及恢复的时间短。逻辑备份根据备份内容可以分为3种模式:
①用户备份:备份某个用户的所有对象以及对象中的数据,业务数据库通常采用这种模式;
②表备份:备份某个用户指定的对象(表);
③完全备份:对数据库所有对象进行备份,主要用于数据库的移植以及系统的备份。
该馆的oracle数据库采用逻辑备份的用户备份方式,手动操作的具体实现方法是:在“命令提示符”窗口输入exp,根据oracle提示进行导出备份,如图2所示。
3.2 汇文系统数据自动备份
汇文系统的数据库是7*24小时运行,因此,为避免进行备份操作时数据变化频繁,备份操作选择在数据操作比较少的深夜时进行,以期达到较好的备份效果,实现方法是将导出备份的命令做成批处理文件,并添加到系统的任务计划,让其在预定时间自动执行。
批处理文件内容如下:
exp userid=system/******@llbsy~file=f:\bak\