一场没有悬念的人机大战与一个悬念重重的未来

来源 :紫光阁文摘 | 被引量 : 0次 | 上传用户:a4951660
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  这场人机大战真正的悬念也许在于AlphaGo的未来。它还可以走多远?它还可以变得多强大?如果一个科技公司能在两三年的时间内把一个机器训练成围棋大师,是否也可以把更多的机器训练成一個律师、一个医生、一个程序员,甚至一个作家、一个艺术家?对于人类而言,这到底是福是祸?
  一场没有悬念的人机大战
  这是一场没有悬念的比赛。至少,谁输谁赢,根本没有任何悬念。全世界都知道柯洁会输。毕竟,我们都领教过AlphaGo的进化速度:
  2015年10月,第一代AlphaGo以5∶0第一次击败欧洲冠军樊麾;
  2016年3月,第二代AlphaGo以4∶1击败李世石,过去10年里最伟大的人类围棋手。
  从樊麾到李世石,对人类可能是一辈子都无法跨越的鸿沟,而AlphaGo只花了5个月时间。
  AlphaGo进化史
  第一代,是击败樊麾的AlphaGo Fan。与Zen/Crazy Stone等之前的围棋软件相比,棋力要高出4子。
  第二代,是击败李世石的AlphaGo Lee。与上一代相比,棋力高出3子。
  第三代,是柯洁如今的对手,也是年初60连胜的:AlphaGo Master。相比于击败李世石的版本,棋力又再次提升3子。
  在李世石之后,AlphaGo又经历了一轮新的进化:
  DeepMind修补了当时与李世石决战时系统暴露的漏洞。整个系统架构经过了重新设计,神经网络从原来的12层增加到40层,而且,不再借助人类棋谱,而是完全通过机器的自我对弈来训练——通过这种自我对弈产生高质量的数据,这意味着它正在按照它的创造者德米斯·哈萨比斯最初制定的目标演化——一个能够自主学习、自我适应的智能体。
  经过一年的算法结构优化,从李世石版的50个TPU(谷歌专门为机器学习而设计的处理器)并行式运算,变成由4个TPU组成“单机版”,运算量降低了90%。AlphaGo的训练时间不再以月计算,而是以周计算。
  AlphaGo Lee
  运行于谷歌云,耗用50个TPU进行计算
  每次搜索计算后续50步,计算速度为10000个位置/秒
  2016年在首尔击败李世石
  AlphaGo Master
  运行于谷歌云,但只用一个TPU机器
  自学成才,AlphaGo自我对弈提高棋力
  拥有更强大的策略/价值网络
  5月23日,中国棋手柯洁(左)对战AlphaGo首局比赛在浙江乌镇举行 ,AlphaGo执白1/4子获胜
  从某种角度来说,我们已经见识了新版的AlphaGo有多强大——2017新年,AlphaGo再次以“Master”的网名在各大围棋对弈网站连胜60场,击败了当世几乎所有的顶尖高手。
  柯洁与AlphaGo的第一局赛后,DeepMind的首席科学家大卫·席尔瓦(David Silver)透露AlphaGo Master可以让李世石版本的AlphaGo 3个子,立刻引来全场哗然。午餐的时候,我刚好坐在一桌棋手边上,所有人都在谈论3子,全是一副下巴掉下来的表情。
  这个差距有多大呢?
  用柯洁的话说,“简单地解释一下就是,一人一手轮流下的围棋,对手连续让你下三步……又像武林高手对决让你先捅三刀一样……”
  后来,大卫·席尔瓦特意向所有媒体写信做了更正:“新版本的AlphaGo,已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色。也因此,新版本的AlphaGo可以让旧的版本3子。但当AlphaGo与从未对弈过的人类棋手对局时,这样的优势就不复存在了,尤其是柯洁这样的围棋大师,他可能帮助我们发现AlphagGo未曾展露的新弱点。这样的衡量标准是无法比較的。”
  尽管如此,我们还是疑惑,为什么还有必要再进行一次人机大战?
  是谷歌重回中国市场的一次外交尝试,还是相信DeepMind的官方解释,“这是因为尽管已经连战连捷,AlphaGo仍然有继续探索的空间。我们仍然想在围棋领域继续追问:我们离最优解还有多远?怎样才是完美棋局?人类3000年的对弈没有找到最佳下法,AlphaGo可以与人类棋手共同探寻这些奥秘”。
  去年的那场人机大战,AlphaGo对战李世石,用李世石自己的话说,第一局震惊,第二局无语,第三局深感无力,第四局力挽狂澜、赢回一局,到第五局再度落败时,深深叹息人类创造力的局限性。
  这次柯洁与AlphaGo Master的比赛,到本文发稿之前为止,已经输了两场。但去年那种悲情的气氛已经消失了,取而代之的,是对于一种异类智能的好奇、敬畏,甚至拜服。
  在比赛现场,不少九段棋手追着DeepMind的工程师,想要观摩AlphaGo的后台数据——AlphaGo每走一步对双方的胜负概率都有预估。他们急于知道,机器到底是怎么评价人类的表现的。
  不止一位九段棋手表示,很愿意被让2子,甚至3子,与AlphaGo Master对弈,以了解对方的真实水平。
  每一个顶尖棋手都在苦心钻研年初AlphaGo Master扫荡棋坛后留下的60张棋谱。作为棋手,他们不得不承认,AlphaGo对围棋是有它自己的“理解”的,而且这种理解的强大与精妙之处,远远超出了人类的想象。
  “很多棋,我们理解不了,我们理解不了的时候就说我喜欢这样,我个性如此……”在第一局赛事后的间歇,著名的九段棋手江铸久这样告诉我,“比如,如果不是AlphaGo,我们不会理解吴清源有多好。AlphaGo的招式是从16万张人类棋谱里选出来的,选出来很多是吴清源的招式。”
  他再次谈起AlphaGo与李世石的第二局比赛中的第37手。“有人认为不够好,有人表示看不懂,当时我一看,就觉得热泪盈眶,我想,莫非是吴老师回来了?”   “只有吴清源才会这么下棋。”
  AlphaGo可以走多远?
  从某种角度来说,是历史选定了这些围棋手,作为第一批与“机器智能”正面交锋的人类,领悟这种智能的强大与奇妙,诡谲与怪异,并被迫重新评估自身的角色、信仰、目标、身份。
  作为一名观战者,这次人机大战对我最大的触动之一,就是这些顶级的棋手对于AlphaGo没有丝毫轻慢之心。连曾经那么年少轻狂的柯洁,也在第二局战败之后这样感慨:“在AlphaGo没出现之前,我可能对棋的了解有50%。AlphaGo出现之后,我对人生看法都有巨大改变,未来不是我等凡夫俗子可以预测的。如果对围棋规则了解就算知道1%,我可能只能算是知道2%。”
  是的,未来不是我们这些凡夫俗子所能预测。这场人机大战真正的悬念也许在于AlphaGo的未来。它还可以走多远?它还可以变得多强大?如果一个科技公司能在两三年的时间内把一个机器训练成围棋大师,是否也可以把更多的机器训练成一个律师、一个医生、一个程序员,甚至一个作家、一个艺术家?对于人类而言,这到底是福是祸?
  事实上,AlphaGo的脚步并不止于围棋。哈萨比斯曾经说过,他创办DeepMind真正的目的是攻克人类的“智力”难题。他认为,学习和通用(general)是人类智力最根本的特征。他想发明一种“通用人工智能”(General AI)——不是自上而下,一点点教机器规则,让它从规则中理解语言、识别人脸;而是自下而上,让机器像人类一样,从观察、经验中学习,像人类一样根据环境的变化做出灵活的决策,像人类一样举一反三,执行各种不同的任务。
  機器学习真的能实现这样的智能吗?
  2015年,美国麻省理工学院一次关于人工智能的研讨会上,有人问乔姆斯基怎么看机器学习,他的反应是嗤之以鼻,认为不过是数据预测,一场华丽的天气预报而已。即使神经网络的翻译获得了某种完美的功能性,它仍然无法揭示语言的本质。机器也许能比人类医生更好地检测肿瘤,但机器永远不会告诉你是什么引发了肿瘤。
  但谷歌一向是典型的工程师思维。对他们来说,人工智能更重要的不是关于理解心智的本质,而是关于制造工具、解决现实的问题。
  事实上,根据谷歌在“人工智能的未来”论坛上(与此次人机大战同期举行)发布的数据,他们的机器学习模型诊断眼疾的准确率,甚至高于一些通过美国认证委员会认证的眼科医生。这些模型还能比放射科医生更快地在医学影像中找到肿瘤,甚至根据病理报告的文本做出诊断。
  在这次论坛上,哈萨比斯还透露,AlphaGo的算法已经被应用于谷歌数据中心的节电项目,并成功节能40%。至于它的未来,可以在材料、医疗、智能手机和教育等各种领域。
  “癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂。如此巨大的信息量让最聪明的人穷其一生也无法完全掌握。那么,我们如何才能从如此庞大的数据量中筛选出正确的见解呢?而一种通用人工智能思维的方式则是自动将非结构化信息转换为可使用知识的过程。我们所研究的东西可能是针对任何问题的元解决方法(meta-solution)。”
  “神经网络和深度学习的爆发是我此生所经历过的最大变革。”前来参加人机大战的谷歌董事长埃里克·施密特(Eric Schmidt)在赛后的一次对谈中这样表示。
  “在谷歌内部,人工智能不只是研发人员的事情,而是贯穿整个公司的战略和技术。无论硬件领域、产品组、服务组等,都在AI的连接下交叉配合,比如谷歌翻译、谷歌照片、谷歌医疗、无人车等产品和项目,背后都有人工智能贯穿其间。”
  与去年一样,在激烈的比赛间隙,杰夫·迪恩(Jeff Dean),谷歌工程师的精神领袖,也是谷歌大脑的负责人于百忙之中介绍了谷歌大脑在过去一年的技术进展。从项目上看与去年韩国首尔所见似乎没有什么大的区别,但技术进展的加速度却令人震惊。以图片识别为例,2011年,机器的图像识别错误率为26%,到2016年已经降低到了3%,比人类的识别错误率(5%)还要低。
  在媒体上引发最大轰动的,是在过去9个月的时间里,谷歌彻底拆除了原先的翻译系统,引入神经网络,大幅提高了翻译的准确率,其中一些语言的准确率甚至提高了85%。随之发布的多语言互译系统,将两种语言的翻译学习“迁移”到更多的语种,比如通过中英互译的学习,就能直接把模型算法迁移到中日、日英等多语种互译方面。如杰夫·迪恩所说,机器“学习如何学习”,将是谷歌未来最重要的研究方向。
  旧翻译系统:基于短语的翻译,先把句子分成一个个短语和单词,然后独立翻译,最后对翻译出来的独立短语解释进行逻辑整理,变成句子
  新翻译系统:神经机器翻译,将整个句子视作翻译单元,对句子中的每一部分进行带有逻辑的关联翻译,翻译每一个字或单词时都包含着整句话的逻辑
  关于人工智能,我们应该警惕的危机
  当我们想象人工智能未来的时候,总是想着库兹韦尔那些关于“奇点”的古怪预言,比如不久的将来,我们会制造出比我们更聪明的机器,它们再造出比它们自己更聪明的机器,如此这般,整个世界朝着我们无法预计的巨型超智能的方向狂奔;再比如,我们很快就能将人的思维载入计算机中,在计算机的电路里获得超强的智力,甚至永生。2014年的反乌托邦电影《超验骇客》中就有一个情节受此启發,其中有个类似库兹韦尔的科学家,他的思维被人载入网络,给人类带来了毁灭性的后果。
  去年,尤瓦尔·赫拉利来中国宣传他的《人类简史》时,我有机会采访到他。他谈到当今世界最重要的变化,就在于“权力和权威正在从人类转移到人工智能、到算法等,而人类却毫无知觉”。
  是的,今天的人工智能与人类智能还有着本质的差异——它不具备情感、不具备欲望,所以,它不会有统治世界、奴役人类的兴趣与野心。但无人驾驶汽车不需要任何欲望或情感就能代替司机,因为按照现实世界经济系统的设定,司机的工作就是把人/物从a送到b,廉价、迅速即可。如果在这方面机器做得更出色,经济系统就会更倾向于机器,而不是有欲望、有情感的人,于是人就变成了多余。
  关于人工智能,我们应该警惕的危机,不是“奇点”,不是超级智能,不是人机大战,而是当下这些因为具备了越来越强的学习能力而变得越来越聪明的平凡机器。
  当然,从机器学习到机器理解,人工智能还有很远的路要走,就像一位人类学家告诉我的,“相信奇点,就像重新相信上帝一样”。但是,作为人类,我们对于这些“聪明”的机器的信任已经超过了自己,而近乎相信上帝了。
  本来,上帝死后,人是一切世界意义和权威的来源,而人的感情、人的感觉、人的自由选择是所有问题最终的答案。但现在,我们正不假思索地将控制权让渡到那些距离真正的“思考”“理解”还很遥远的机器手中,甚至将整个文明置入自动化的快车道。最吊诡的是,在整个权力/权威的交接过程中,每一步都显得如此的理所当然,令人无可拒绝。
  今天,再没有人用自己的头脑来做加减运算,因为计算器要快速准确得多。我们信任百度地图,远远胜过自己的方向感。学习一门新的语言听起来是一件性价比越来越低的事情,因为谷歌的翻译越来越强大了。
  我们依赖机器告诉我们,哪些信息更重要、更有用、更值得关注;我们依赖机器告诉我们,应该看什么电影、读什么书、听什么歌,甚至选择什么样的伴侣;更深入一点,当面对一个生死攸关的医疗选择时,你觉得你会相信自己、相信医生,还是相信机器?当年安吉丽娜·朱莉切除两侧乳房,不是因为她自己的身体出现问题,也不是出于医生的诊断,而是机器告诉她,她所携带的一种突变基因,意味着她有7%的可能性将来会患上乳腺癌。所以,很有可能,在我们此后一生当中,关于我们的身体,那些性命攸关的医学决定,都将不再取决于你自己的感觉,甚至医生的意见,而是会由计算机、电子算法和巨大的数据库来决定。
  “工作,本来应该由人来完成的,现在越来越多地由机器来完成。决定,本来应该由人凭借感觉与理性做出的,现在越来越多地由算法来做出。而且,每一步都让你觉得无法拒绝。”赫拉利说,“在此过程中,人渐渐变得无用、多余。这是为什么你知道世界正在发生非常严重的变化。”
  (本文选自:三联生活周刊 2017年23期)
其他文献
龙川村,青山环抱,绿水萦绕,阡陌纵横,鸡犬相闻,一派世外桃源的景象。风水大师们称龙川村布局,如出海龙舟,是藏龙卧虎的风水宝地。  “一生痴绝处,无梦到徽州”。  钟灵毓秀、人杰地灵的徽州大地,秀丽的自然风貌让人叹为观止,而极具地方特色的人文景观,更是吸引着众多游客,前往徽州寻梦。  早已名声在外的宏村西递,自列为世界文化遗产后,游客便蜂拥而来,古村落的恬淡宁静,已然不复存在。  避开五一小长假,挑
期刊
美国对中国的500亿美元科技产品征税迫在眉睫,人民币惶惶,端午节后第一天,人民币对美元大幅贬值575个基点,跌到了6.50关口。若美国对中国产品征25%的关税,很多人自然联想到人民币可以贬值25%应对,据此已经有预测人民币贬值到7.0甚至更低的声音。殊不知,贸易战绝不会以如此简单的方式解决问题,人民币升贬牵一发,动全身。  人民币大幅贬值的后果,不用远观,近期就有警示。自2015年“8·11”汇改
期刊
“心灵的风景:泰特不列颠美术馆珍藏展”正在上海博物馆进行。展览带来了庚斯博罗、康斯泰布尔、透纳、米莱斯等英国著名画家的风景画作品,横跨从古典主义到浪漫主义、拉斐尔前派、印象派、超现实主义直至当代英国绘画的发展历程。虽然时间跨度有300多年,但焦点仍集中在18世纪末到19世纪这段英国风景画的黄金时期。  “风景本身就是一种向所有人开放的语言,观赏者和风景艺术家都不需要深刻地了解希腊神话、古典故事或者
期刊
今年是改革开放四十周年。四十年来,对外开放的基本国策都得到了稳定和延续,中国也因对外开放而取得了巨大的历史成就。  十九大报告指出,中国坚持对外开放的基本国策,坚持打开国门搞建设。今年4月,国家主席习近平在博鳌亚洲论坛的主旨演讲中也再次强调,中国开放的大门不会关闭,只会越开越大。  不断提高对外开放水平,不但是国内经济改革、发展的需要,而且也是推动构建新型国际关系、推动构建人类命运共同体的需要。中
期刊
1914年6月28日是個星期日,这天早上,身为奥匈帝国皇位继承人的弗朗茨·斐迪南大公偕夫人索菲亚乘坐火车来到萨拉热窝,之后改乘汽车经由阿佩尔码头前往市区。  一  对奥匈帝国来说,这个出访的日期并不吉利。1389年的这一天,奥斯曼帝国的军队在科索沃战役中击败了塞尔维亚王国贵族的军队,结束了塞尔维亚在巴尔干地区的统治,并为日后奥斯曼帝国吞并塞尔维亚打下了基础,这一天也被当地人称为“圣维特日”。对于由
期刊
从国家或民族利益的角度来看,赵匡胤聪明反被聪明误,“杯酒释兵权”完全是他的一大政治败笔,是他一生中所犯的最大政治错误。  乍一看,赵匡胤的“杯酒释兵权”好像很潇洒,很轻易,令人真有那种“谈笑间,樯橹灰飞烟灭”的感觉,似乎不费什么劲,手腕多多的赵匡胤便将这件原本应该非常棘手的事情给搞定了。  但在实际上,赵匡胤却为此付出了巨大的代价!从国家或民族利益的角度来看,赵匡胤聪明反被聪明误,“杯酒释兵权”完
期刊
和英国军队一样,一战爆发时的法国陆军只装备了一款制式手榴弹。但和英军的同类武器不同的是,法军的这款手榴弹是属于另一个时代的“老古董”。随着战事的发展,法国军队的手榴弹及其战术也逐步丰富起来。奥尔良王朝的武器  在1914年投入一场欧洲大战的法国士兵手里也有手榴弹。从其名称就可以看得出它的“历史悠久”:M1847型球形手榴弹。  1847年是奥尔良王朝的末期。这个王朝是波旁王朝复辟后建立的,当时正是
期刊
摘 要:梵高是伟大的,他的伟大不仅是因为其艺术作品本身所具有的人文情怀和艺术情怀,更主要是其为艺术而燃烧自己生命的伟大殉道主义精神,他的不朽足以当之无愧的堪称为世界画坛屈指可数的艺术巨匠。  关键词:梵高;绘画;人文情怀;艺术情怀  一、孤寂的情感世界与悲悯的人文情怀  梵高出身于牧师世家,他从事过画商工作,做过短暂的传道士,也曾想仿效基督做一个心灵高洁的圣徒;他曾经历过痛苦的恋爱但一次次的以失败
期刊
明明是好政策,出台多年却未能落地执行,企业无法享受政策红利且投诉无门……记者调研发现,近年来,国家层面已陆续出台多项支持实体经济发展、降低企业成本的好政策,部分政策尽管已出台多年,却因“先天不足”“后天失调”,一直处于“休眠”状态,沦为“僵尸政策”。  政策出台15年没落地,现场问询遭“踢皮球”  重庆某大型商贸有限公司每年从欧洲国家进口服装、箱包等商品。企业负责人介绍,在国际贸易交易过程中,买卖
期刊
帕慕克的最新小说《红发女人》是他所有作品中最受土耳其人欢迎的一部。  土耳其语版本的《红发女人》自2016年发行以来,销售已经超过40万册。帕慕克的朋友对他开玩笑,说它之所以最畅销,是因为又薄又便宜。这么说也不无道理,它确实短小、紧凑、好读,10余万字的篇幅和他上一部小说《我脑袋里的怪东西》相比,體量差不多只有其三分之一。所以,帕慕克欣然接受了这些玩笑话。不过,他在接受本刊专访时告诉我们,或许还有
期刊