网“助”云计算

来源 :计算机世界 | 被引量 : 0次 | 上传用户:wt920997920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  如果说,云计算这种巨型计算服务所要求的IT架构必然是集结了大规模基础资源的数据中心“超级航母”,那么,它也必然要求大规模的计算网络来与之相适应。
  
  当前热门的云计算拥有近乎无限的计算、存储、数据通信能力。云计算对IT资源的大规模集中运营,可极大地优化基础资源的分布与调度。理想的云计算业务模型(如图1所示)对于使用云计算服务的企业或个人而言,能够满足业务的最佳方式为计算能力按需增长、应用部署快速实现、工作负载可动态调整、投入成本规划可控;对于云计算服务供应商而言,为满足大量客户(个人或企业)的IT资源需求,其运营的IT基础架构需要有一个大规模的资源池,可基于服务客户数量的增长、客户业务负载增长的需求变化,提供与之匹配的IT资源支持能力。
  大规模的IT集中建设与运营,带来的将是大幅度的成本节约效应。提供云计算服务的IT架构必然是集结了大规模基础资源的数据中心“超级航母”。在大规模云计算运营趋势下,IT基础组件必然走向全面标准化,以使得云所支撑的各部分可以在保持发展的同时相互兼容。当前虚拟化标准组织、云计算标准化组织已经基本形成,它们的工作目的就是制定云计算不同组件、不同技术之间的公共接口,这样,众多的软硬件供应商就能够在云计算环境下提供互通、协作的标准化产品,以求在远期目标上使得云计算的大规模IT运营架构逐步摆脱隔离性、垄断性,使公共服务得以构建在开放的公共化标准技术基础上,并随着技术发展而持续降低成本。
  大规模的计算网络,在基础形态上主要有两种模式:虚拟化计算与集群计算。其实这两种方式并非完全地割离,既可分别部署,也可相互结合。
  
  大规模虚拟化计算
  
  虚拟化计算技术已经逐步成为云计算服务的主要支撑技术,特别是在计算能力租赁、调度的云计算服务领域起着非常关键的作用。
  在大规模计算资源集中的云计算数据中心,以X86架构为基准的不同服务器资源,通过虚拟化技术将整个数据中心的计算资源统一抽象出来,形成可以按一定粒度分配的计算资源池(如图2所示)。虚拟化后的资源池屏蔽了各种物理服务器的差异,形成了统一的、云内部标准化的逻辑CPU、逻辑内存、逻辑存储空间、逻辑网络接口,任何用户使用的虚拟化资源在调度、供应、度量上都具有一致性。
  虚拟化技术不仅消除了大规模异构服务器的差异化,其形成的计算池还可以具有超级的计算能力,一个云计算中心的物理服务器达到数万台是一个很正常的规模。一台物理服务器上运行的虚拟机数量是动态变化的,当前一般是4~20个,某些高密度的虚拟机可以达到100:1的虚拟比(即一台物理服务器上运行100个虚拟机),在CPU性能不断增强(主频提升、多核多路)、当前各种硬件虚拟化(CPU指令级虚拟化、内存虚拟化、桥片虚拟化、网卡虚拟化)的辅助下,物理服务器上运行的虚拟机数量会迅猛增加。一个大型IDC中运行数十万个虚拟机的情形是可预见的,当前的云服务IDC在业务规划时,已经在考虑这些因素。
  在虚拟化云计算网络环境中,超高密度的虚拟机数量引入了有别于任何以往传统意义上数据中心的业务承载问题,在表象相似的网络平台上,“服务器/虚拟机”的数量在单位空间和单位网络接口剧增,对基础网络的转发表项、吞吐能力、突发流量吸收提出了苛刻的要求。
  虚拟化的云中,计算资源能够按需扩展、灵活调度部署,这由虚拟机的迁移功能实现,虚拟化环境的计算资源必须在二层网络范围内实现透明化迁移。
  透明环境不仅限于数据中心内部,对于多个数据中心共同提供的云计算服务,要求云计算的网络对数据中心内部、数据中心之间均实现透明化交换,这种服务能力可以使客户分布在云中的资源逻辑上相对集中(如在相同的一个或数个VLAN内),而不必关心具体物理位置;对云服务供应商而言,透明化网络可以在更大的范围内优化计算资源的供应,提升云计算服务的运行效率、有效节省资源和成本。
  
  大规模集群计算
  
  集群计算很早就广泛应用了,只是在不同的领域有着不同的表现形式,或者说有不同的术语,如在科学计算领域的并行计算或高性能计算当前主要以集群计算的方式实现。集群通过一组松散集成的计算机软件和/或硬件连接起来,高度紧密地协作完成计算工作,在某种意义上,集群可以被看做是一台计算机。
  人们使用集群的目的是为了获得强大的计算能力,虽然这可以通过购买具备超级计算能力的大型机来实现,但是那样在成本投入上是巨大的。对于一般计算机,计算能力是有限的,虽然摩尔定律(摩尔定律被普遍认为在过去30年相当有效,未来10~15年依然适用)说计算能力每18个月可以翻一番,但要达到大型机的性能,很长一段时间内还是难以实现的。因此,为突破摩尔定律的限制,将多台低成本计算机通过集群方式,以并行计算来获取更大的计算能力,成为各种追求高性能计算的主流方向。
  以互联网应用为例,有的计算服务要求提供超级计算能力,如大型搜索引擎的构建,就是大量服务器群共同协作实现的巨量计算。
  科研领域并行计算的主流技术是MPI(Message Passing Interface),但以支持Fortran、C语言的科学计算为优势。云计算领域的代表性技术是Hadoop(还有其他类似的分布式计算技术),突出商用的扩展性架构、大数据量处理,大大简化开发难度,屏蔽系统底层的复杂性。
  Hdoop是目前互联网广泛使用的一种云计算支撑架构,借助于Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于大型计算机集群上,完成海量数据的计算。这一类的集群架构将服务器按群分置不同角色群,角色协同完成大规模计算任务,这些角色包括:NameNode,在 HDFS 内部提供元数据服务;DataNode,为 HDFS 提供存储块。NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件,负责管理文件系统名称空间和控制外部客户机的访问。DataNode 响应来自 HDFS 客户机的读写请求。NameNode 与每个 DataNode 有定期心跳(heartbeat)消息检查健康性。
  分布式文件系统的设计需求对应到网络的架构上主要有:并发吞吐性能、可伸缩性、容错需求等。
  HDFS的目标就是构建在大规模廉价机器上的分布式文件系统集群,一个文件可以表示为其内容在不同位置的多个拷贝。这样做带来两个好处:访问同一个文件时可以从多个服务器中获取从而改善服务的伸缩性;另外就是提高了容错能力,某个副本损坏了,仍然可以从其他服务器节点获取该文件。同时,集群内部还通过心跳检测、集群的负载均衡等特性提升容错性。
  传统HDFS采用一种称为rack-aware的策略来改进数据的可靠性、有效性和网络带宽的利用,典型的组网逻辑如图3所示。图3中每个交换及所接服务器被安装在数据中心的同一个机架(rack)内,该交换机称为Top of rack switch,典型情况下每个机架内部署40台服务器(国外比较流行,国内当前达到这样密度的IDC很少),一般采用48千兆端口的交换机,传统设计中会采用4~8个千兆上行,因此每个机架上行的带宽收敛比一般在5:1~10:1。
  不同机架间的两台机器的通信需要通过交换机,通常情况下,同一个机架内的两个节点间的带宽会比不同机架间的两台机器的带宽大。因此Hadoop 的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度。
  通过一个称为Rack Awareness的过程,Namenode决定了每个Datanode所属的rack id。一个简单但没有优化的策略就是将副本存放在单独的机架上。这样可以防止整个机架(非副本存放)失效的情况,并且允许读数据的时候可以从多个机架读取。这个简单策略设置可以将副本分布在集群中,有利于组件失败情况下的负载均衡。但是,这个简单策略加大了写的代价,因为一个写操作需要传输block到多个机架。
  为了降低整体的带宽消耗和读延时,HDFS会尽量让reader读最近的副本。如果在reader的同一个机架上有一个副本,那么就读该副本。如果一个HDFS集群跨越多个数据中心,那么reader也将首先尝试读本地数据中心的副本。
  HDFS支持数据的均衡分布处理,如果某个Datanode节点上的空闲空间低于特定的临界点,那么就会启动一个计划,自动地将数据从一个Datanode搬移到空闲的Datanode。当对某个文件的请求突然增加时,也可以启动一个计划创建该文件新的副本,并分布到集群中以满足应用的要求。
  Hadoop系统在开发过程中关注了数据交换对象(计算节点)之间的距离,实际上是考虑了网络构建模型中带宽不匹配的因素。这种因素的引入,不仅编程人员需要关心,业务部署人员、网络维护人员也都要关心,在小规模环境下还能够勉强运行,但是如果要支持全互联网级的大规模应用,集群可能达到数千台、数万台,业务的部署、扩展、运行、支撑都会存在很多问题。
  随着网络交换万兆技术的发展和设备成本的不断降低,目前大规模集群的构建也发展到新的阶段,需要新的网络结构来支持和运行:
  
其他文献
具有不同架构的数据中心适合于不同的应用,也各自面临不同的挑战。同时,数据中心网络也会根据需求的不同而呈现不同的规模。只有清晰地掌握了数据中心的任务和对数据中心的关键性要求,才能优化数据中心的设计。  “数据中心”一词常常被人们作为一种统称来描述所有的计算环境。事实上,不同的服务要求其应用设计也要具有不同的特点,因此,数据中心的架构会存在显著的差异性。除此之外,对于数据中心网络而言,其规模大小也各不
光大永明人寿信息技术部总经理刘东煜和往常一样,平静地整理着办公桌上的资料,开始一天的工作,但她的内心却不能平静下来。因为,在2010年7月20日这一天,光大永明人寿保险公司关于增资扩股变更资本结构的申请,得到了中国保险监督管理委员会的正式批复。资本结构变更后,公司性质转变为中资保险公司。    “企业性质变更和股东大规模增资后,公司的资产投资规模在寿险行业已经排到第六名。所以,光大永明人寿必须以尽
4月18日,用友软件股份有限公司高调发布UFIDA U9(以下简称“U9”),这是全球第一款完全基于SOA架构的商业应用套件,并支持多组织业务协同和多工厂制造协同。    瞄准世界级    据用友软件股份有限公司董事长兼总裁王文京介绍,U9是用友在单一产品的研发中投入最大的,投资额达数亿元。  从一开始,U9就瞄准了世界级的目标。“经过20多年的发展,中国已经具备了培育世界级管理软件的基础。”王文
谷歌发布Chrome OS 操作系统  本报综合消息谷歌上周发布了Chrome OS操作系统以及Chrome应用商店,但第一批搭载Chrome OS的笔记本电脑的上市时间晚于预期。  谷歌CEO埃里克施密特称:“Chrome OS为桌面电脑提供了(除微软Windows和苹果MacOS之外的)第三种选择。”如今,大多数PC均使用Windows或Mac OS系统,谷歌发布Chrome OS,标志着这家
HP ProLiant G7服务器包括面向高密度环境设计的1U机架服务器DL165 G7、针对关键业务型应用设计的2U机架服务器DL385 G7、面向虚拟化和数据库应用设计4路机架服务器DL585 G7、以及刀片服务器BL465c G7和BL685c G7。  跟上一代服务器相比,HP ProLiant G7升级的不只是CPU,而是几乎重新设计的整个平台。以DL385 G7为例,跟G6相比,处理器
坏消息    本报讯日本公平交易委员会目前表示,计划要求美国高通公司在与日本手机生产商进行业务往来时,停止滥用其技术垄断地位,因为此类做法可能打击日本企业进行研发的积极性、并遏制公平竞争。相关的日本手机厂商包括NEC、三菱电机和松下移动。  据称,高通禁止采用其技术许可的日本生产商对其提起诉讼(即使在高通公司侵犯日本生产商专利权的情况下),这违反了日本的反垄断法; 高通还在与手机生产商签署的协议中
“蓝牙4.0之后,蓝牙技术联盟近期没有推出蓝牙5.0的计划。当前,蓝牙技术联盟的主要工作是推动蓝牙4.0的落地,特别是在医疗、汽车领域,为蓝牙4.0建设一个更为强大的生态系统。”蓝牙技术联盟技术总监Andy Glass在日前举行的一次媒体交流会上告诉记者。  蓝牙技术是一种全球通用的短距离无线通信标准,广泛地应用于手机、笔记本电脑、医疗设备、相机等电子设备中,用以实现多种电子设备间的相互连接。目前
编者的话:危机之下,企业更应着力寻找新的市场机遇。上周各大调研机构发布的报告显示,智能手机和电子阅读器将成为IT领域最受关注的两大产品; 而社交网络的“老龄化”,也将为其带来更多广告。  突破4亿大关 智能手机销量2011年将超过PC  本报综合消息市场调研机构RBC分析师迈克艾布拉姆斯基上周发表报告称,2011年底全球智能手机销量将超过PC,届时二者销量将双双突破4亿大关。  RBC称,2008
编者的话:量大不一定是好事。第二季度上网本出货量尽管占了PC总出货量的20%,却严重影响了PC厂商的利润; eBay于2005年收购的Skype并未转化为公司的良性资产,令其不得不在近日出售Skype 65%的股权; 7月份,Google继续领跑全球搜索市场,市场占有率高达68%。  形同“割肉” eBay出售Skype 65%股权  本报综合消息上周,eBay宣布将旗下Skype公司65%的股份
在上海世博园浦西展区,有一个展馆被称为“魔盒”,在它的内部,设计师用112 块大型的LED 屏幕,组装出了一个720度的“幻想空间”—这里就是国家电网馆。通过这个魔幻的空间,“魔盒”向普通观众们讲述了电力如何满足中国这样一个幅员辽阔的国家的用电需求,以及如何跨越3000 公里以上的距离传输电能的故事。  在“魔盒”的地下一层,还有一个智能电网展区,在这里,衬托着“魔盒”的魔幻意境,让人感到智能电网