基于VMware技术的虚拟机系统在数字图书馆中的构建

来源 :图书情报工作网刊 | 被引量 : 0次 | 上传用户:vbkiller2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要] 基于VMware vSphere技术的虚拟机系统正广泛应用于数字图书馆的发展与建设中。利用虚拟机技术,可以降低硬件投入成本,提高服务器使用效率,更好地消除传统单一物理服务器部署的弊端,从而有效地实现数字图书馆信息化应用系统的高可用性。针对VMware技术在数字图书馆建设的体系构建,从虚拟机系统架构、数字图书馆虚拟机系统的建立、关键技术的应用等方面阐明观点,指出虚拟机备份是一个不可忽略、应引起重视的问题。
  [关键词] VMware 虚拟机 虚拟化 数字图书馆
  
  1 引 言
  
  数字图书馆是人类社会进入信息化时代的产物,随着数字化图书馆建设的不断发展,各类数据库、电子图书、电子期刊等文献资源不断增加,Web2.0、Lib2.0、Opac2.0等新技术不断带来新型数字化信息服务,信息共享空间(IC)建设模式在世界范围内逐步推广,图书馆正逐渐成为网络化、数字化和多功能的信息中心。面对日益复杂的数字图书馆应用,保障各种系统正常的、永不间断地提供服务响应,已经成为图书馆对信息化建设的进一步要求,而虚拟机系统的产生正好为这种要求提供了应用发展空间。
  
  2 VMware虚拟机技术
  
  虚拟机是通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。通过虚拟机软件,你可以在一台物理计算机上模拟出多台虚拟的计算机,这些虚拟机完全就像真正的计算机那样进行工作,可以安装操作系统、安装应用程序、访问网络资源等[1]。VMware就是这样一个虚拟机软件,由它创建的虚拟机与真实的计算机相同,这个虚拟机有自己的CPU、内存、硬盘、光驱,可以安装Windows、Linux等真实的操作系统及各种应用程序。
  2.1 软件虚拟化技术
  首先要解释几个概念。宿主计算机(Host PC),指物理存在的计算机;宿主操作系统(Host OS),指运行在宿主计算机上的操作系统,在这个操作系统下安装的虚拟机应用程序可以在计算机上模拟出一个或多个虚拟机[2];客户操作系统(Guest OS),指运行在虚拟机上的操作系统。例如,在一台安装了Windows XP的计算机上安装了VMware,那么Host PC指的是安装了Windows XP的这台计算机,其Host OS为Windows XP。如果虚拟机上运行的是Linux,那么Linux即为Guest OS。
  软件虚拟化技术是指在实体主机的硬件系统和操作系统之间试图建立一个称为VMM(Virtual Machine Monitor,虚拟机监视器)的软件监控层,用来阻隔操作系统与硬件系统的直接通信。所有来自操作系统的指令都将被VMM截获,并通过VMM的分析和转换后,再转向控制硬件系统。VMM对系统指令的拦截和转换的特殊作用,使得在VMM上可同时支持多个异构操作系统的运行。VMware就是软件虚拟化技术的代表产品,它采用的是完全虚拟化技术(Full Virtualization),其基本核心是整个的虚拟化过程不对硬件系统和客户操作系统进行任何修改,完全依赖VMM来支持和管理多个异构的客户操作系统(Guest OS)的并发运行。
  2.2 VMware技术结构
  VMware依据不同时期、不同技术的产品,有两种结构形式:寄居结构(Hosted Architecture)和高级结构(“Bare Metal” Architecture)。
  寄居结构(Hosted Architecture)是VMware产品中一种技术发展较早、应用层次较为大众化的结构形式。寄居结构的特点是作为虚拟化技术核心的VMM是一种运行在Host OS之上,将VMware作为Host OS的一个应用程序来运行的结构,这种结构对Host OS的寄生性,使得它可通过继承Host的设备驱动来得到更为广泛的硬件支持,也可利用Guest OS和Host OS平台的相似性来减少VMM对来自Guest OS指令的延迟。虽然寄居结构必须依赖于Host OS的良好支持,但VMM可以有效地为多个Guest OS的正常运行提供很好的技术隔离,使这些OS能独立享用CPU、内存、I/O等硬件资源。当然,这种结构对Host OS的依赖性,会使得Host OS一旦失效,将导致整个VMM的失效。如图1所示:
  
  高级结构(“Bare Metal” Architecture)形式是把VMM作为独立的一层系统软件直接运行在硬件平台上。作为计算机硬件系统和Guest OS的通信层,它完全独立地响应所有Guest OS对硬件资源的访问。这种结构的VMM就像一个操作系统,包含硬件平台的各种设备驱动,非常适合于构建企业级服务器的系统环境。因为高级结构的系统独立性,使得VMware的近期产品提升到了一个决定性的技术地位。以高级结构为技术支持的VMware ESX Server,其内核可以直接运行在硬件系统之上,因此克服了VMM对Host OS的性能和可靠性的依赖和影响,减少了Host OS所占用的系统资源,从而使整个虚拟机系统的性能、稳定性和安全性都有很大的提高。正因为如此,高级结构已经成为企业级服务器中VMware产品的标准。如图2所示:
  
  2.3 VMware虚拟机系统关键特征
   兼容性。与物理计算机一样,虚拟机承载着自身的客户操作系统和应用程序,并具有物理计算机上的所有组件(主板、VGA 卡、网卡控制器等)。因此,虚拟机与所有标准的x86操作系统、应用程序和设备驱动程序完全兼容,这样就可以使用虚拟机来运行在x86物理计算机上运行的所有相同软件。
   隔离。虽然虚拟机可以共享一台计算机的物理资源,但它们彼此之间仍然是完全隔离的,就像它们是不同的物理计算机一样。例如,如果在一台物理主机上运行4个虚拟机,其中1个虚拟机崩溃,其他3个虚拟机仍然可用。在可用性和安全性方面,虚拟环境中运行的应用程序之所以远优于在传统的非虚拟化系统中运行的应用程序,隔离就是一个重要的原因。
   封装。虚拟机实质上是一个软件容器,它将一整套虚拟硬件资源与操作系统及其所有应用程序捆绑或“封装”在一个软件包内。封装使虚拟机具备超乎寻常的可移动性并且易于管理。例如,可以将虚拟机从一个位置移动和复制到另一位置,就像移动和复制任何文件一样;也可以将虚拟机保存在任何标准的数据存储介质上,从袖珍型的USB闪存卡到企业存储区域网络(SAN),都可用于保存。
   独立于硬件。虚拟机完全独立于其底层物理硬件。例如,可以为虚拟机配置与底层硬件上存在的物理组件完全不同的虚拟组件(如CPU、网卡、SCSI控制器等)。同一物理主机上的各个虚拟机可以运行不同类型的操作系统(Windows、Linux等)。
  
  3 VMware技术在数字图书馆建设中的应用体系
  
  VMware vSphere是基于高级结构的虚拟机产品,是VMware公司虚拟产品中的核心,它利用虚拟化功能可以将数据中心转换为简化的云计算基础架构,其最大优点就是其内核可直接运行在硬件之上,不但可以大大减少Host系统对硬件资源的占用,也使得虚拟机的系统稳定性和性能都有很大的提高。
  3.1 虚拟机系统架构的建立
  建立VMware Infrastructure虚拟机系统,首先要考虑架构的物理拓扑结构。VMware Infrastructure架构包含ESX服务器主机、磁盘阵列或网络存储、以太网络、vCenter管理中心。ESX服务器主机为虚拟机的运行提供了硬件环境和使用资源。完整的虚拟机系统架构是由多台ESX服务器主机组成的集群,保证虚拟机的负载均衡、动态迁移、HA高可靠性;网络存储连接到各ESX服务器主机,存放虚拟机磁盘文件,是虚拟机动态流动的传输通道;以太网络是虚拟机工作与管理的基本保障;而vCenter管理中心是VMware Infrastructure架构的枢纽,提供配置虚拟机资源、访问控制、性能监控等服务功能。
  北京第二外国语学院(简称北京二外)图书馆早在2008年就已经成功应用了虚拟机系统,在数字图书馆发展建设上积累了很多的经验。下面以其VMware Infrastructure物理架构来说明前期建设的重点,如表1所示:
  
  ESX服务器主机应尽量选择相同或相似的硬件配置,否则可能因为些许差异如CPU的主频不一致而造成HA高可靠性和FT容错功能的实施受阻。存储卡的冗余设计是虚拟机系统实施的关键之一。虚拟机一般存放在存储设备上,是因为存储设备比本地磁盘容量要大很多,可以建更多虚拟机,且都具有RAID安全级别和全局热备磁盘作保障。通过SAN的存储网络也可以提供高效稳定的应用环境;配有多个以太网口是虚拟机系统实施的关键之二。虚拟机所提供的服务器应用系统都需要网络对外发布信息和提供服务,建立ESX主机集群系统也需要网络进行支撑,虚拟机的动态迁移、负载均衡、冗余配置、网络带宽等都需要多个网络出口。在实际应用中,可以通过2个网卡的绑定为虚拟机提供虚拟交换机,并为虚拟机的迁移管理提供服务,所有网卡必须都为千兆;ESX主机的大容量内存是虚拟机系统实施的关键之三。每一个虚拟机的建立都要分配给1-2GB的内存空间,在ESX主机上建立的虚拟机内存容量总和要与ESX主机内存基本相符,不能相差太大,否则会造成虚拟机系统的不稳定。
  
  图3为北京二外图书馆虚拟机物理架构拓扑图。虚拟机服务器分为对外服务器、对内服务器、校园一卡通网络内的服务器,因此物理网卡被虚拟为三种不同应用网络的虚拟交换机(红色链路标志),网卡被绑定考虑冗余。这样的架构使得增加如下任何一种应用的虚拟服务器都非常方便:①与对外服务有关的图书馆导航系统、图书馆主页系统、图书馆论文提交系统等;②与对内服务有关的图书馆门禁系统、图书馆内部知识库系统等;③与校园一卡通应用有关的上网计费系统、自助存包系统、自助复印打印系统等。
  3.2 数字图书馆虚拟机系统的建立
  在数字图书馆应用系统中主要有两类系统:数字资源发布系统和信息服务系统。前者如电子图书系统、电子期刊系统、全文数据库系统、视频数据库系统、学位论文系统等。后者如参考咨询系统、图书馆学科导航系统、图书馆门户网站系统、学位论文提交系统、自助复印打印系统等。众多的系统需要物理服务器提供支持,不但硬件成本高,资金需求量大,而且从安装操作系统、应用系统到使用、维护、更新,都给技术人员带来了很大的工作量,效率低下,出现故障也不能很快地发现与解决,因此虚拟机系统的出现解脱了对技术人员的束缚,减少了对硬件服务器以及与之相关的空间、冷却、电力等成本,保证了业务服务的安全稳定与连续不间断运行[5]。
  在建立数字图书馆虚拟机系统时,可以利用VMware系统提供的模板功能,部署或克隆出多台虚拟机。在使用模板之前,需要先安装一台样板虚拟机,根据功能需求划分相应的CPU、内存、硬盘,配置网卡和网络VLAN号,然后在每个虚拟机上安装所需的操作系统,可以是Windows、Linux或Unix,安装过程和物理机上的操作完全一样。最后在操作系统上进行相应的配置,安装应用软件。样板虚拟机生成后可以转化为模板,将来可以通过“部署”或“克隆”方式快速生成虚拟机,在硬件服务器上需要花费几个小时做的事情在这里只需要几分钟就可以完成。同时,也可以将模板作为应用系统的备份,在系统出现被攻击、病毒破坏,系统启动不起来的情况下,将模板快速部署,可将系统恢复回来。
  对于现有的在物理服务器上运行的系统可以采用迁移的方式移到虚拟机上运行,需要用到VMware vCenter Converter工具,可以迁移在线的物理机[6]。迁移过程中物理服务器不用关闭系统,但是正在运行的数据库如SQL Server需要停止运行,否则迁移会失败。迁移完成后,需要先将源物理机关机,再启动转换好的虚拟机,以免主机名和IP地址冲突。
  3.3 虚拟机系统关键技术的应用
  VMware的VMotion功能、HA功能、容错FT功能、Storage VMotion功能、DRS功能都是分布式服务,可自动有效地管理各种资源,实现虚拟机的高可用性。
   VMotion功能可将正在运行的虚拟机从一台物理服务器主机迁移到另一台物理服务器主机,不需要中断服务。这对于检修物理服务器主机、升级硬件配置、调整整个系统都具有很大帮助。图书馆业务系统的连续性是反映图书馆服务质量的一项重要依据,而涉及整体系统的调整如图书馆局域网系统的调整、物理服务器主机网络和存储的调整、物理服务器主机硬件故障等情况,势必会影响到在主机上运行的虚拟机系统。VMotion功能可以帮助我们将一台物理服务器主机上的所有虚拟机系统迁移到了另一台上,业务却不中断,这是数字图书馆关键应用的保障之一。
   在VMware vSphere系统中,VMFS是一个重要的概念,它是使用共享存储的虚拟文件系统,允许多个物理主机同时读写同一存储器。VMFS提供磁盘锁定,以确保多台服务器不会同时启动同一虚拟机。如果物理主机出现故障,系统将释放每个虚拟机的磁盘锁定,以使虚拟机可在其他物理主机上重新启动,这就是HA的功能。HA监控群集内的所有物理主机并检测主机故障,如果主机出现故障,HA能快速地在群集内的其他物理服务器上自动重启虚拟机。这是数字图书馆关键应用的保障之二。
   HA功能虽能保证业务系统从故障主机迁移到其他主机,并自动重新启动系统,但提供的业务服务还是会中断,FT容错功能能够保障业务服务的连续性。FT借助于VMware vLockstep技术,以虚拟锁步方式运行的辅助虚拟机来保护主虚拟机,从而提供连续可用性。系统会记录在主虚拟机上执行的输入和事件,并在辅助虚拟机上进行重放,以确保两个虚拟机的状况保持一致,所以可在不中断或不丢失数据的情况下在任何节点处由辅助虚拟机接管执行。这是数字图书馆关键应用的保障之三。
   在VMFS系统中,虚拟机是作为一组文件存储在数据存储中的目录中的,可以作为普通文件进行复制、移动或备份。可向虚拟机添加新的虚拟磁盘,系统将在VMFS中创建虚拟磁盘文件(.vmdk),从而为添加的虚拟磁盘或与虚拟机关联的现有虚拟磁盘文件提供新存储,这就是Storage VMotion技术的应用。Storage VMotion可以将正在运行的虚拟机磁盘文件从一个共享的存储位置重新定位到其他共享存储位置,可以添加新的虚拟磁盘空间,并且保持虚拟机处于运行状态而不用停机,以便执行维护、重新配置LUN、解决空间不足问题和升级VMFS卷,实现了服务平台的连续可用性和系统的完整性。这是数字图书馆关键应用的保障之四。
   DRS功能是实现虚拟机对资源需求的动态负载均衡,保障主机集群对资源的分配策略,当主机集群中的条件发生更改,如虚拟机的增加、可用资源的变化等,DRS可根据情况使用VMotion将虚拟机迁移。DRS功能可设置为自动、半自动、手动,一般设为半自动方式,经过确认实施VMotion动作,避免DRS功能的频繁启动。DRS功能优化了VMware系统环境,是数字图书馆关键应用的保障之五。
  
  4 虚拟机系统的备份
  
  在数字图书馆的建设中引入VMware vSphere虚拟机技术,得到五大安全性能的保障,但并不是我们的业务系统就可以高枕无忧了,系统本身带来的问题如病毒、系统瘫痪、可能出现的蓝屏等现象,都会影响到我们的对外服务工作,因此虚拟机系统的备份是非常重要的。
  虚拟机系统的备份和物理服务器系统的备份性质是一样的,VERITAS NetBackup备份系统同样可以在虚拟机上运行。另外虚拟机VMFS系统的特点,使得虚拟机的备份可以像文件拷贝一样将虚拟机文件拷贝出来进行备份。还有第三方针对虚拟机备份的软件系统如Vizioncore vRanger,提供了内置的计划任务工具,自动执行备份工作,并支持在线热备或虚拟机关机状态下备份,具备全备、增量及差分备份功能,以减少存储空间。
  目前虚拟机技术正越来越广泛地被应用于数字图书馆发展与建设,在它发挥重要作用的同时,对其进行备份是非常必要的,应引起重视。
  
  参考文献:
  [1] 吴乾清.基于VMware的数字图书馆服务器虚拟化研究与应用.科技情报开发与经济,2010,20(21):47-49.
  [2] 吴德萍.虚拟机技术在图书馆服务器端的应用.图书馆工作与研究,2008,18(2):15-17.
  [3] H3C数据中心虚拟化解决方案技术白皮书.[2011-03-14].
  http://wenku.baidu.com/view/8075ad315a8102d276a22f10.html.
  [4] 刘荣发.服务器虚拟化技术在图书馆数字化服务中的应用.现代图书情报技术,2007(4):79-82.
  [5] 陈思义.VMware在图书馆数据中心管理中的应用.图书情报论坛,2010(1):56-58.
  [6] 王炜.虚拟化技术在图书馆自动化管理中的应用.晋图学刊,2008(5):60-63.
  
  [作者简介] 朱海涛,男,1967年生,高级工程师,部主任,发表论文10余篇。
其他文献
[摘要] 运用CiteSpaceⅡ和Google Earth软件,从前沿演进、代表人物与研究热点、Google Earth 的合作网络三个层次,对肺损伤与修复领域前沿进行可视化分析,研究和探讨该领域的知识基础、演进路径、代表人物、前沿热点、合作的地理分布等。  [关键词] 科学知识图谱 肺损伤与修复 CiteSpaceⅡ Google Earth
期刊
[摘要] 2010PNC联合会议是太平洋邻里协会顺应图书馆发展趋势以及数字信息资源在现代技术支持下的管理使用所发起的一次国际讨论会议。会议重点探讨数字资源的管理、知识资产的转变、e-learning、数字图书馆的发展等议题,为我国数字图书馆的发展和数字信息的建设提供了值得借鉴的宝贵经验。  [关键词] 数字资源 知识管理 数字图书馆 e-learning    1 前 言    太平洋邻里协会(P
期刊
[摘要] 针对高科技企业的实证研究表明,管理者情绪领导行为能够对员工知识分享产生显著影响。其中,鼓励安慰导向的情绪领导行为能够促进员工知识分享,员工心理资本起到部分中介作用;威严冷峻导向的情绪领导行为能够抑制员工知识分享,员工心理资本起到完全中介作用。因此,管理者需要表现出更多的积极情绪导向行为,充实员工心理资本,优化心理情境,从而促进知识交流和共享。  [关键词] 情绪领导行为 心理资本 知识分
期刊
[摘要] 介绍当前国际国内机构库建设概况以及机构库软件平台的选用情况。在调研的基础上重点介绍国际流行的机构库建设软件平台Dspace和Eprints以及国内建设较完善的机构库所使用的软件平台,并简单分析各种机构库软件平台。[关键词] 机构库 机构库软件平台 Dspace Eprints 国内机构库软件平台  1 机构库建设概况    随着开放存取运动的开展,机构库应运而生,并在信息社会到来
期刊
[摘要] 张宗祥《〈说郛〉跋》是研究涵芬楼排印本《说郛》的基础文献。《跋》存有油印本、遗稿《铁如意馆随笔》本以及排印本三种版本,虽然屡经更定,却仍存在误笔之处,前辈学人在研究的过程中又产生一些误解。以张宗祥《〈说郛〉跋》为切入点,利用各家图书馆所藏抄本《说郛》,对跋文及前人研究有待商榷之处加以申说和匡正。  [关键词] 张宗祥 说郛 跋 订补 明抄本      张宗祥(1882-1965年
期刊
[摘要] 利用可视化软件CiteSpace Ⅱ对CSSCI数据库中检索到的2 039篇文献的信息进行研究发现:刘则渊、陈劲、李垣等是《科学学研究》的核心著者,浙江大学、清华大学、西安交通大学等是期刊的核心发文单位;OECD、魏江、陈劲等是期刊文献引用较多的作者;“技术创新”、“科技政策”、“知识管理”等是期刊的主要研究热点;在研究热点的知识基础中,傅家骥的《技术创新学》、侯杰泰的《结构方程模型及
期刊
[摘要] 利用可视化软件CiteSpace Ⅱ对CSSCI数据库中检索到的2 260篇文献的信息进行研究发现:叶文虎、曲福田、毛显强等是《中国人口资源与环境》的核心著者,中国科学院、北京大学、南京农业大学等是期刊的核心发文单位;叶文虎、张坤民、胡鞍钢等是期刊文献引用较多的作者;“可持续发展与生态环境建设”、“循环经济与生态环境”、“环境保护与经济增长”等是期刊的主要研究热点;在研究热点的知识基础中
期刊
[摘要] 采用《中文核心期刊要目总览(2008)》“图书馆学、情报学类核心期刊表”中的19种核心期刊的资料数据,利用CNKI的“中国期刊全文数据库”和“中国引文数据库”,统计2005-2009年由公共图书馆系统的作者为第一作者发表的论文数及被引次数等,对各级公共图书馆科研产出及影响力进行分析,并探究其原因。  [关键词] 公共图书馆 科研产出 影响力 学术研究    1 引 言    公共图书馆、
期刊
[摘要] 以网络调查的方式,对我国98所“211工程”高校图书馆的图书超期处理政策进行列表比较分析,指出目前我国高校图书馆超期图书的处理政策单一,对超期罚款政策“一刀切”,内容简单化,罚款金额没有统一标准等问题进行思考。认为高校图书馆要积极探索和实践以其他政策取代超期罚款,用非经济手段促进文献的流通及资源的共享。  [关键词] 图书超期处理政策文献流通    本文采取网络调查的方式,访问了国家教育
期刊
[摘要]根据对设有建筑学专业的有关高校统计及对其使用建筑学导航库的调查分析,从导航库的界面布局、资源组织类型、资源收录数量、检索功能等若干方面进行分析,探寻建筑学网络资源导航库可持续发展的路径。  [关键词]学科导航 网络资源 建筑学    1概述    1.1 概念界定  学科网络资源导航库,是以学科分类系统为基础,以提供重要学术网站和免费学术资源为目的的集中服务的全球网络资源导航数据库[1]。
期刊