实现非结构化数据的整合

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:wahahabookbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  企业在信息化过程中需要处理大量报表、账单、影像、电子文档、图片、音频、视频等非结构化数据,这些数据难以用传统的关系型数据库管理,内容管理遂应运而生。许多企业都正在评估和选择实现信息资源整合的最佳途径,而其中绝大多数所瞄准的都是基于文件结构使用SAN或NAS进行整合的这种方式。
  
  数据整合的驱动因素
  
  进行存储系统整合的根本目的是为了减少存储资源的数量。文件服务系统的规模会随着新的企业应用的部署和新的扩展需求而不断增长,最终会形成一个拥有越来越多文件服务器的庞大的文件服务环境。
  1.降低管理成本
  系统整合所带来的一个好处就是能够减少企业的IT管理工作。随着需要管理的存储设备的减少,处理这些管理任务所需要用到的人力资源也可以相应地减少。而如果任随这些系统不断增长,随着时间的推移,最终将积累起大量的文件服务器资源,这些资源的维护对IT人员来说将是一个极大的负担。
  2.经济利益
  存储系统整合的实现同样会对企业的经济产生极大的正面促进作用。当企业将多个系统整合成一个之后,就能够节省下多余的软件许可费用和磁盘空间,得以节省大量的IT成本。更重要的是,IT管理员花费在管理这些系统进行软硬件更新和解决相关问题上的时间也能够得到极大的节省。
  3.资产保护
  实现存储系统整合的另一个基本的驱动因就是要更好地进行企业资产的保护。备份机制是否为数据提供了足够的保护?有没有合适的安全控制?如果这些过程都能够从中央来统一进行和控制,那么以前所必须要进行的备份过程的次数以及系统的安全控制点都能够大大减少,企业就将有机会确保企业资产都得到了完善的保护。
  
  实现整合的不同方式
  
  目前在整合多个存储系统时有多种不同的方式可供选择。一种方式企业购买一个大型NAS设备并淘汰掉其他小型的存储系统,在整个企业范围内只存在一个存储系统;另一种方式是采用虚拟数据中心的方式,也就是说其他已有的小型存储设备都隐藏在一个中央存储系统之后或分散在不同的物理地点,所有的资源实际上和以往一样都仍然存在,但只有一个单一的数据界面需要管理。
  1.文件服务器整合
  存储系统整合的第一种类型是针对那些被部署用于解决某个特定应用需求的单独的文件服务器。在原有的基础架构之下,越来越多的文件服务器会随着新的企业应用的上线而被独立部署到企业IT环境中,企业的存储系统将无法避免地变得越来越膨胀。我们的目标是通过设施整合将系统控制在一个更小的机构,比如一个工作小组或一个部门中统一集中起来。常见的处理问题的方法是安装部署一个“全功能盒子”或类似的设备将这些多个文件服务器结合在一起并放到一个统一的平台上去。
  通常,一个NAS设备盒可以整合5到10个文件服务器。在一个数据中心环境中,企业的数据,也即存储在这些文件服务器上的信息将被整合到一个中央控制点,这些过程通常在数据中心里处理和完成。 文件服务器在完成整合之后,系统的可用性和可靠性将比单独的文件服务器的集合要高的多。
  2.非结构化数据的整合
  在向企业现有的系统中添加其他应用时所要面临的一个主要问题在于,系统是做为存储资源的角色而存在的,如果一个应用本身有一些问题,那么对存储信息的访问就可能受到影响,而部署了文件区域网之后,这种情况将有效地得以避免。因此非结构化数据整合是一个具有更高系统可用性和可靠性的解决方案。
  很显然,企业之所以使用基于文件的存储系统(如文件服务器)的一个主要的目的就是为了进行数据的共享,而在实现非结构化整合之后,数据的访问控制就能交由中央统一进行控制,这个优势在某些情况下特别有用,一个典型的例子是它支持从一个地方就能建立起所有的访问权限策略而不必访问多个存储点才能定义好数据的访问级别。
  存储系统整合的第二种类型其实反映出了存储产业的一个逐步成熟的过程。已经拥有了多个NAS设备并部署了NAS系统的企业开始意识到现有的整合规模可能还是太小了。从经济尺度的角度来说,一个更大的存储系统或者一个中央化的存储设备将引发更多的投资和原有数据的迁移,因此建立虚拟的数据中心将成为趋势。
  这种类型的中央化整合或者说通过虚拟数据中心管理软件可以将数据中心的存储设备与分散的文件服务器进行整合。现在企业普遍都有一个共同的认识,即一个更大型的NAS系统有助于增强存储系统扩容性方面的能力并且能够消除分布各处的独立的存储设备,但存在整合过程较为复杂以及成本过高的问题。建立虚拟的非结构化数据中心将能够统一管理分布在各个物理地点的存储设备,但为管理员和客户提供唯一的访问路径,显然更加符合企業不断扩展,多个物理数据中心并存的现实状况。
  
  其他需要考虑的因素
  
  企业在实现了存储系统的整合之后还是有一些其他的因素是需要认真考虑的,其中包括系统的安全控制,数据的迁移和管理过程上的变化等等。
  1.访问权限的管控
  即使实现了整合,原先存在的那些安全问题依旧还是会存在。系统的整合并不意味着就不再需要对访问控制列表的权限进行设置了。可能对于那些相对复杂困难的安全过程的设置来说,系统整合之后在这方面会比较有优势,或者在清理这些安全过程所创建的一些访问控制规则时会更容易一些,但无论如何安全控制的实现仍然是不可或缺的。
  2.非结构化数据的迁移,复制,分发
  整合之后的数据迁移过程同样必不可少。现在市场上有多种数据迁移解决方案可供选择,比如有一些硬件设备产品可以帮助完成数据的迁移,在这些设备内部有一个数据转移器,它在把数据从一个系统转到另一个系统的同时仍然可以为数据的访问提供服务。另外也有一些主机服务软件程序可以完成这个过程。最后,市场上还有一些只负责转移数据的设备提供给用户。
  在数据从文件服务器或其他NAS设备上迁移到整合的中央平台后,比较理想的情况是访问权限设置和控制列表等所有其他东西也都能够自动一起全部迁移过去。因此在实现整合的过程中非常重要的需要认真考虑的一点是,象安全控制、访问控制等诸如此类的信息也都必须要被迁移到整合后的平台上。Brocade公司的StorageX产品全面实现数据的迁移,权限的继承,路经的自动更新等重要功能
  3.数据操作流程的变化
  另一个需要认真考虑的因素是在整合之后企业的数据操作流程可能会发生变化。数据的备份方式将与以往有所不同。不管是数据快照还是克隆,如果能够在不同的存储平台上实现时间点拷贝功能的话,就有机会把中央化整合做得更好一些。另外在整合之后也将有机会能够利用一些远程数据功能来实现更好的商业连续性。多数情况下,新平台中做为标准功能提供的那些新功能新特征在老的平台上是找不到的,或者即使有也要更昂贵得多。Brocade公司的StorageX产品和FLM 产品将数据按照重要性分类,提高备份的策略性和恢复的速度。
  在整合计划实现的过程中有机会可以选择去改变企业现有的数据操作和管理模式,去发现整合系统所带来的这样或那样的优点,最终得出一个更好的数据操作流程从而实现更好的数据安全保护和更高的数据可用性,以及缩短数据在备份时的系统宕机时间等等。
  4.非结构化数据的虚拟数据中心符合集中管理分布使用的需求
  在计划存储系统整合的时候还有一些比较特别的问题需要考虑,那就是政策问题。一个企业里可能会有不同的部门或机构,而它们又都有自己独有的控制域,因此在隔离各个控制域的时候就有一些问题需要解决。某些解决方案可能会选择在一些平台上安插某种类型的虚拟NAS设备来实现隔离。而如果企业同时要求存储系统支持更加全局化的数据访问的话,那么在这种情况下自然就会有其他一些政策因素需要考虑。
  在整合的过程中,很多时候人们希望能够基于不同组织对资源的使用情况来对各个组织进行内部收费。因此很重要的一点是我们要弄清楚我们所选择的平台是否具有这方面的功能,比如是否能够根据不同组织在使用资源时对容量和访问能力的不同要求来确定应该分配给对方多少资源回充率,以及是否能够支持细粒度的针对部门组织甚至个人的资源使用率收费等等。通常这要求硬件设备能够支持一些配套的软件来收集这些信息并加以利用。
  5.评估存储设备的承载力
  在制定整合计划的时候,至关重要的一点是要立足于未来,要花时间去仔细评估存储系统的承载力是否具有向前发展的能力。整合计划的成功与否依赖于企业是否在各个方面都有经过周密的计算,包括是否该全部整合到一个设备上,这个设备能够满足多长时间的需求,它是否具有必要的扩展能力等。其他要问的问题包括存储系统最终会达到什么样一种规模,而现在这种整合方式是否能够达到那种规模等。
  在实现整合的时候,要确保整合后的系统可以支持所有的企业所要求的访问和条件,包括响应时间和带宽等等。正确地做出这些决定是要求企业对系统的整合有一个全面且完整的了解,不成熟或欠考虑的决定在日后可能会迅速变成一个瓶颈,并出现在整合后资源时常过载的情况。这就是为什么在市场上具有优秀扩展能力、能够同时支持容量上的增加和系统性能上的提升的解决方案显得更加有吸引力的缘由。
  
  总结
  
  非结构化数据的整合是一个能够解决很多问题并让很多事情变得更加容易的解决方案。问题在于有时候人们并没有足够认真地对待它们。有些人在进行了一部分调查之后就轻易放言“你看,这个地方我可以很快地把它们整合起来”,但他们常常并没有考虑到明年或后年情况会出现什么样的变化。
  要考虑清楚,你的企业和机构为了保持商业的运作需要提供怎样的数据存储和信息访问?整合计划应该是企业全局战略的一部分。它的角色并不是一个用于降低企业当前管理成本的一次性万能灵药。整合计划应该是一直不断向前的,它应该依企业的需要而持续发展。
  还有一点很重要的是要把企业现有的数据操作特征联系在一起。在新的平台上我们可以发掘出许多能够改善企业数据操作流程的功能。这些管理上的改善随着时间的推移在存储系统不断扩展的过程中将始终不断地展现出其价值。
其他文献
正当全球金融危机逐步蔓延的时候,东软集团董事长兼CEO刘积仁博士在东软年度解决方案论坛上却乐观地表示:事实上从创业的那一天开始,我们一直在冬天里;如果跟17年前比,今天可以说是东软真正的春天。  “东软2008解决方案论坛”上,刘积仁发表了题为《持续改进与开放式创新》的长篇演讲。他告诉人们,东软的17年间,营业收入由创业初期的30万元增长至2007年的33.5亿元,增长了11166倍,公司总市值超
我认为,从超级规模层面上看,今后全球会形成数家基于宽带网络的计算机服务巨头。如此看来,IBM创始人托马斯·沃森(Thomas J. Watson)当初“全球只需5台计算机”的错误判断,其实也有其正确之处。  也许,Google将是一个,微软的live.com是第二个,Yahoo!、Amazon.com、 eBay和Salesforce.com是第三、四、五、六个。当然,还有许许多多服务提供商,但他
面对日趋激烈的竞争,中国建设银行需要整合、统一、改进其存储基础设施。赛门铁克数据管理解决方案帮助该行将存储利用率提高50%,避免购买10TB的新增存储容量,还能够管理每年以50%的速度递增的数据量,而不会增加管理时间,存储管理员数量减少40%。  中国建设银行(以下简称建设银行)继续在企业、个人和财政银行领域全面扩展其金融服务。此外,建设银行还在不断推出新的服务,比如网上银行。    统一基础设施
无须争论,这是一个伟大的进程。  七年中,起步于军工电子的中国信息产业进入了改革开放以来的新繁荣期 ——从2001年产值首度突破万亿到2007年产值5.6万亿元的超大规模,一跃成为世界第二。  也不必讳言,这是一个还并不完美的进程。  依赖于廉价劳力、资源耗费等粗放式增长路径的“超大规模”,至今仍难攀结构优化、自主创新的更高境界。  诞生于新世纪第一年的中国信息产业经济年会,有幸亲历,并观察、记录
还有什么不能刀片化?惠普已经拥有了刀片式PC、刀片式工作站、刀片式存储、刀片式的工业标准化服务器,如今高端的NonStop服务器也有了刀片式的产品。惠普一切皆刀片的理念已经成为现实。    提升性能 降低成本    新发布的HP Integrity NonStop NB50000c是全球首款面向24×7关键业务计算的刀片服务器。它将NonStop服务器原有的高可用和容错性与刀片服务器低成本、配置灵
方案一:FORP管理平台全面版    FORP律师事务所作业流程管理平台全面版,包括作业流程管理、案件管理、客户管理、律师知识管理、律师个人工作平台、行政办公、人力资源和费用管理等几大模块。  FORP律师事务所作业流程管理平台全面版,除经济版提到的基本模块外,增加了案件管理、客户管理、行政办公、费用管理几大功能。对人员架构复杂、业务全面、案件交叉的大型律师事务所比较适合,对其管理模式的规范起到很
在竞争日益激烈的显示器市场中,如何克服同质化的陷阱,制造出与众不同的产品?各大厂商除了在技术上不断推陈出新之外,也开始在显示器产品的外观设计方面苦下功夫。LG的两款显示器产品就是这样,它们都拥有与众不同的底座设计。  其中,LG Fantasy系列液晶显示器被设计师将底座设计成了别致的圆环形,并且在圆环形底座内侧嵌入了红色光源设计,当触及红色光源时,显示器就会划出一道美丽的光弧。另一款显示器LG
北京奥运会前后,中国IT业界的领先公司陆续发布了最新的财报。国产PC企业销售增长放缓,甚至出现下滑的现象,而惠普、戴尔、联想、Acer等跨国巨头却利用其全球运营的优势继续保持增长势头。不过因为市场竞争加剧的原因,一些厂商的利润有所下滑。在电信行业,中国各大运营商的日子似乎过得还不错,电信重组也让人们对中国电信市场的前景充满想象。互联网广告、网络游戏、电子商务等行业无论是销售收入还是利润,依然表现抢
受到信息安全市场迅猛发展的推动,我国曾经诞生了一大批信息安全企业。然而,在巨大的市场面前,很多企业却因为不能很好理解信息安全的内涵,选择了错误的方向和产品,最终不能得到应有的利润和市场。因此,不少企业开始怀疑信息安全市场是不是泡沫,也有些企业开始犹豫并转向了其他领域。  可就在不久前,成都卫士通信息产业股份有限公司(以下简称卫士通)却成功成为国内首家上市的信息安全公司,并且之前其综合经济指标保持了
关键字:互联网/Web 2.0    梦想终究需要现实来考验,只有经受得起考验,梦想才能真正变为现实,中国Web2.0正处在由梦想走向现实的路上。  为何在美国红红火火的Web 2.0到中国却水土不服呢?许多人把这个问题归咎于中国互联网的发展环境。的确,中国互联网的发展环境与美国存在较大的差异,不过这不是Web 2.0在中国表现不佳的全部理由。他们忽略了Web 2.0本身的一些陷阱,而这些陷阱对于