由亚马逊宕机引发的思考

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:lyklcjs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  云灾备这个新概念在国内逐渐兴起,将备份和容灾放到云中渐成趋势。亚马逊这次停服事故让记者联想到,如果云服务商三天两头出问题,那么用户还敢放心地采纳云灾备吗?
  3月又发生宕机了!美国当地时间3月10日,亚马逊再次发生停服事故,前后持续约20分钟。这次事故不仅导致亚马逊电子商务主网站无法访问,而且也波及到了亚马逊的其他服务,其中就包括亚马逊云计算服务,以及一些数字内容服务等。
  云计算在给个人和企业用户带来诸多便利的同时,近几年来频繁发生的各种云事故也增加了人们对云的担心。最近一段时间,云灾备这个新概念在国内逐渐兴起,将备份和容灾放到云中渐成趋势。亚马逊这次停服事故让记者联想到,如果云服务商三天两头出问题,那么用户还敢放心地采纳云灾备吗?
  宕机,见怪不怪
  既然谈到宕机,那么不妨先回顾一下过去两年全球范围内发生的曾引起广泛关注的云事故。
  2014年11月2日下午,腾讯云服务器出现了6分钟的访问故障。腾讯云网站响应速度慢,图片打不开,并出现无法登录管理中心控制台等问题。
  2015年,5月27日晚6点时左右,杭州、北京、上海、武汉等地用户反映,支付宝无法正常使用。支付宝公司对故障的回应称,杭州萧山某地光纤被挖断,导致故障。
  2015年6月21日,阿里云香港节点当天9点30分左右突然全线崩溃,截至当晚22点才逐渐恢复,整体过程历时近13小时。
  2015年8月22日,位于美国硅谷的富士通数据中心供电异常,导致公有云服务暂时下线,5天后才恢复正常。
  不用再继续了吧。上述诸多例子已经说明,随着云服务的普及,各种原因导致的宕机也成了家常便饭。
  “公众应该认识到,云并不能保证万无一失。随着云上的应用越来越多,业务价值越来越重要,影响越来越广泛,宕机也会是常态。”英方股份(以下简称英方)CEO胡军擎表示,“有些用户以为,采用了云计算以后,就可以把安全、业务连续性等问题完全交给云计算厂商去解决,这就如同把数据问题交给磁盘厂商一样不合理。”云服务商可以为用户提供云主机,但是如何保护云主机,是否采用灾备,这些事情还是要用户自己来考虑和决定。
  “公有云很脆弱,它们本身也需要做灾备。”备份、容灾软件提供商中科同向总经理邬玉良开门见山,“数据越集中,风险也越集中,尤其是集中部署的电子商务、云计算系统,一旦发生宕机,用户会损失惨重。”邬玉良补充说,中科同向有针对公有云的灾备解决方案。
  同样专注于数据保护和容灾领域的爱数公司认为:如果仅仅是灾备的数据在云中,那么云本身出现问题,对应用的影响有限;如果用户的业务系统在云中,那么为了避免因云出现问题而导致损失,用户应该事先对云中的业务做备份和容灾。使用阿里云的爱数公司,会定期将业务数据从云中备份到本地,以防止出现云故障时不能对外提供服务。
  灾备需求会永远存在
  看到亚马逊宕机的消息后,记者第一时间询问国际灾难恢复(中国)协会(DRI China)总裁于天对此事的看法。他表示:“根据目前得到的有限信息,无法对亚马逊宕机事件做出评价。但是,并非只要发生问题就一定要给个差评。从专业的BCM(业务连续性管理)的角度看,业务系统永远不发生问题,这是不现实的。我们更关注的是,在问题发生后,如何评估影响,并采用积极有效的措施解决问题。这才是业务连续性管理和灾备存在的价值。”
  于天认为,从报道的内容来看,亚马逊宕机20分钟后就恢复了正常,仅从这一点来看,并不能说明亚马逊在灾备方面做得不好(当然还要看其用户所受影响大小,以及亚马逊对用户的承诺)。因此,用户不必对公有云过分忧虑,如果真的由此而不敢采用公有云,那就是因噎废食。当然,宕机事件必须引起足够重视,并深入分析问题的根源。从BCM的角度出发,只要采取有效的措施,就可以降低发生问题的概率,减少不良影响。
  3月11日,可信云服务第五次情况通报会在北京举行,会上公布了可信云服务第五批认证结果:在72家云服务商提交的87项云服务中,30项云服务通过了第五批可信云认证,通过率为35%,较前四批有所下降。
  会上还首次公布了可信云云主机可用性检测情况。2015年9月至2015年12月,可信云云主机可用性监测的平均可用性达97.7%~99.9%,31%的云主机连续6个月达到了自身承诺可用性。这基本反映了当前国内云主机的可用性状况。从统计数据看,保持云主机的连续可用性任务艰巨。
  美国飞康公司副总裁、亚太区总经理杨政表示:“作为云灾备的一个重要载体,云服务提供商能否保证自身基础架构的安全、可靠非常重要。对于用户来说也是如此,把IT迁到云端并不代表解决了所有管理方面的问题。这些云服务的提供商也许有兴趣和我们这些软件定义存储或虚拟化软件的厂商坐下来探讨一下,如何进一步提升云的可靠性,让用户更放心。”
  作为云灾备服务商,英方也不能完全保证用来做灾备的服务器不宕机。英方能做到的是,实现合理的灾备部署,保证生产系统和灾备系统不同时宕机。“在任何情况下,企业都应该未雨绸缪,防患于未然。这也是英方提出‘让世界早有准备’的初衷。”胡军擎表示。
  现在是全球知名的亚马逊出现了宕机,引起了人们的广泛关注,如果换成国内的阿里云出现故障呢?我们只能说,出现宕机的情况其实很正常。就像服务器厂商不可能承诺自己的服务器100%不出问题一样,云服务商也不会做出相同的承诺。这也说明,不管到了什么时代,即使是云全面普及的时代,灾备、高可用性的需求仍会存在。用户必须认真考虑灾备,这是必不可少的一环。
  容灾要讲究方法和策略
  “比起数据大集中,云模式的安全风险更大,因为云把所有企业和与之相关的系统、应用全都集中在一起。”万国数据高级副总裁张权表示,“如果企业能够采用混合架构,就能更好地分散风险。另外,采用云计算以后,智能化的监控和运维就显得非常必要和重要。只有采用智能化的监控和运维,才能更快地发现问题,解决问题,缩短RTO的时间。”   谈到云灾备,深蓝云海系统部总监姜亚杰表示:“首先,云灾备系统并不是生产环境,所以云服务商的宕机不会影响生产系统;其次,云灾备的监控尤为重要,一旦发现问题,必须及时采用应急处理措施;最后,云灾备本身可以通过级联或‘一备二’的方式进行灾备的灾备。”
  作为阿里云的钻石合作伙伴,英方云独有的字节级数据捕获与复制技术可以实现I/O级别的数据增量传输,占用带宽低,节省存储空间;其多方位数据加密技术,可确保数据传输安全可靠。
  简单说,所谓云灾备就是将传统采用物理机的灾备端替换为云平台,以便提供更具弹性、灵活性和经济性的灾备服务。胡军擎举例说:“如果用户选择利用阿里云的云主机来承载自身的关键业务,那么就应该同时在阿里云的另外一个节点上部署应用级的灾备。我们与阿里云联合提供的高可用的云主机服务是这样做的。”
  2016年3月,深蓝云海刚刚发布了应用级的云灾备平台。“我们会针对用户的应用系统级别和相应的灾备需求,制定相应的灾备策略。有些系统可以采用‘本地HA(高可用)系统 应急’的方式,有的可以采用数据级的容灾,还有些系统适合部署应用级的云容灾,那些特别重要的系统可以考虑采用基于异构云平台的应用级容灾。”姜亚杰表示。
  由此可见,无论是在物理环境中的容灾,还是云容灾,都要对症下药,针对客户的不同需求和保护等级采用合理的容灾解决方案。
  张权深有同感:“灾备这个话题比较复杂,针对不同类型和需求的客户,解决方案和实施策略可能是不同的。其实,灾难恢复,不管是采用传统的架构,还是采用云,其核心问题都是数据的复制。数据复制一定要及时、有效、可靠,这样才能谈得上有效恢复。”
  “相比传统的灾备,云灾备更加复杂,数据复制也更麻烦,尤其是对于那些大型的拥有比较复杂的IT架构的客户来说更是如此。”张权告诉记者,“针对一些系统比较简单、数据量不太大的中小用户,市场上有很多适合的灾备解决方案,可以实现数据级或应用级的灾备。当然,实现应用级的灾备相对复杂一些。”
  “未来,当云计算普及后,云灾备这个概念可能就没有了,因为所有的业务上云后,业务的安全性、可用性可能要从云的整体系统架构的层次来考虑。”现在,越来越多的IaaS服务商向PaaS领域扩展,涉及的系统和应用可能会更多更复杂,如果想做应用级的灾备,实现难度也会更大。
其他文献
贝美互动科技(以下简称贝美互动)是中国领先的互动娱乐物联网公司,致力于通过物联网、人工智能技术打造全新互动场景,链接设备、人、内容与服务。  物联网行业的新标杆  Pepper是贝美互动独家研发的配网技术,借助于该技术,硬件产品可以实现一键高速配网,配对速度可以锁定在5秒以内,首次配网的成功率更是达到了惊人的99.9%,而相比之下,目前业界类似的快捷配网技术的配网成功率只能达到90%,配网速度更是
为了让更多的用户感受到爱普生投影机带来的高品质享受,爱普生从8月开始,陆续在上海、广州、北京、南京、杭州、成都和重庆等地展开巡展。本次巡展最大的亮点就是世界首款采用激光光源的4K级家用投影机CH-LS10000。  CH-LS10000是目前爱普生家用投影机中集大成者,囊括了爱普生所有的顶级技术,包括:全新激光光源、全新4K增强技术、全新3LCD反射式液晶面板,可以让用户感受到影院般的效果。  激
自1956 年机器人产业诞生后,经过近60年发展,具有感觉、思维、决策和动作功能的智能机器,已经被广泛应用在装备制造、新材料、生物医药、智慧新能源等高新产业,推动了人类社会生活方式的变革。按照国际机器人联盟(IFR)的分类,机器人一般分为工业机器人和服务机器人。服务机器人是除工业机器人之外的、用于非制造业并服务于人类的各种先进机器人,主要包括个人/家用服务机器人和专业服务机器人。  随着物联网、大
2016年政府工作报告提出,要推动新技术、新产业、新业态加快成长,以体制机制创新促进分享经济发展,建设共享平台,做大高技术产业、现代服务业等新兴产业集群,打造动力强劲的新引擎。运用信息网络等现代技术,推动生产、管理和营销模式变革,重塑产业链、供应链、价值链,改造提升传统动能,使之焕发新的生机与活力。  由此,分享经济再次成为市场热点。分享经济,也被称为点对点经济、协作经济、协同消费,是指建立在人与
作为金融的“毛细血管”,小贷、典当、担保、商业保理等传统金融行业已经深入小微金融的各个角落,为传统企业的发展提供的强有力的助推,解决了小微企业融资难、融资慢、资金周转等经营问题。  2012年互联网金融(P2P理财)强势崛起,为小微金融机构和传统民间借贷机构提供了发展助力,也给传统企业提供了跨界经营的工具,各个机构纷纷拥抱互联网,一时间P2P平台、众筹平台、消费金融、“互联网 供应链金融”如雨后春
在大多数安全厂商都在谈论下一代防火墙时,山石网科在自己的下一代防火墙产品名字前面加上了“智能”二字,称为“智能下一代防火墙(iNGFW)”。那么,相对于其他下一代防火墙,山石网科的“智能”体现在什么地方?  近日,山石网科发布了最新版本的智能下一代防火墙,借此机会,山石网科再次向外界阐述了其“智能”的含义和升级。而面对越来越隐蔽的网络攻击和安全威胁,安全设备的智能化,具有了更为重要的意义。  两大
本报讯 4月28日,在2015年“首都网络安全日”活动上,北京市公安局网络安全保卫总队与腾讯安全、安全联盟,启动了警企合作的 “天下无贼——金盾守卫计划”。各方将通过联手协作,共享信息诈骗数据库,“首都网警”微信公号、微博账号有针对性地发布网络诈骗安全防范知识,提升网民自我防范能力,推动构建安全、文明、和谐的网络环境。发布会上,腾讯安全、北京网安总队、安全联盟等携手发布了《反信息诈骗白皮书》,梳理
10月20日,中国首届行业(私有)云安全技术论坛暨中国行业(私有)云安全能力者联盟成立仪式(简称PCSF2016)于北京万寿宾馆举行,不管是在上午的闭门会议和高峰论坛中,还是在下午的主论坛,“务实、落地、干货、成果、开放”这些关键词是大会的整个主旋律。能容纳约700人的会场座无虚席,近400多名政府、央企、电信、金融、电力、交通等行业用户和300多业内人士参会。  上午的闭门会议和高峰论坛,重点联
本报讯 2016年7月25日,工业和信息化部在山东威海组织召开全国信息化和软件服务业工作座谈会,副部长怀进鹏出席会议并讲话,部信息化和软件服务业司司长谢少锋做工作报告。  会议的主要任务是,学习贯彻习近平总书记在网络安全和信息化工作座谈会,以及全国科技创新大会上的讲话精神,落实《国务院关于深化制造业与互联网融合发展的指导意见》和《关于软件和集成电路产业企业所得税优惠政策》等政策文件,以及全国工业和
电力系统的任何中断都会造成巨大的社会和经济影响,因此国家电网实时监控着各个省电力公司的业务系统运行情况。这对原本主要依靠专有硬件设备堆砌来解决系统可靠性的黑龙江省电力系统向灵活敏捷的云计算转型,提出了巨大挑战。  近年来,我国能源电力取得了举世瞩目的发展成就,发电装机、用电量、电网规模均位列世界第一。如何响应国家号召,加强供给侧结构性改革,保持持续增长动力,以改善供给体系的结构和效率,是电力行业的