王小川谈人机大战:重演了一部进化史,重新认识智慧的边界

来源 :商业价值 | 被引量 : 0次 | 上传用户:samxustyle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  AlphaGo三番棋对决中的第二盘昨日打响,最终柯洁不敌阿尔法围棋,第二盘告负,目前双方比分0:2。
  随后搜狗公司CEO王小川在知乎上发布评论文章称,2017人机大战的意义在于它重演一部进化史,重新认识智慧的边界。王小川表示,“AlphaGo2.0 告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。”
  王小川认为,AlphaGo 2.0与1.0已大不相同,新的算法对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。王小川猜测,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。
  在王小川看来, AlphaGo2.0已经 完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。
  附王小川评论全文:
  该来的终于来了。
  一年前 AlphaGo 发布,看完论文后我就在知乎上发文预测机器会完胜人类。好些行业朋友不相信,为此我收了很多“智商税”,之后微信发红包一直发到春节才发完。此外我还立了两个断言:一个是 Google 很有可能再研发出 AlphaGo 2.0,摆脱“监督学习”,不再需要人类下围棋的历史数据,而是只通过“增强学习”,两台 AlphaGo 自我对战学习如何下棋,并达到登峰造极的地步。从公开的资料判断,此言中了。这意味着什么呢,又有什么看点呢?
  技术重大提升:和 1.0 原理大不同,更接近于人
  AlphaGo 1.0 是巧妙地混合了三种算法:蒙特卡洛树搜索 + 监督学习 + 增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比 1997 年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习 3000 万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是 AlphaGo 获得突破性进展的关键算法。而增强学习作为辅助,是两台 AlphaGo 从自我对战众中学习如何下棋,据悉对棋力提升有限。
  根据公开资料推测,此次 AlphaGo2.0 的技术原理与之前有着巨大不同:
  1. 放弃了监督学习,没有再用人的 3000 万局棋谱进行训练。这本是 AlphaGo 最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。
  2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从 AlphaGo 2.0 的“马甲”Master 的历史行为看,走棋非常迅速,约在每 10 秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。
  3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。
  在这样的算法下,AlphaGo 2.0 对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。我猜测如此算法下,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。
  最大看点: AlphaGo2.0 棋风完全脱离人类经验
  今年年初,AlphaGo 化身 Master 连胜人类顶尖棋手 60 局。在围棋领域,机器完胜已经变成公认的定论。这导致很多人开始问:这次人机大战还有意义吗?我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。
  AlphaGo 学习了 3000 万步人类棋谱,走棋风格也近似于人。在比赛现场,偶有 AlphaGo 走棋和人的经验不符合,就被评为“愚蠢”,只是在中盘之后发现机器渐渐局面占优最终获胜,为了自圆其说解读为“AlphaGo 中盘逆转”,前两局莫过如此。第三局开始评论者长了教训,开始尊称 AlphaGo 为“阿老师”,有了欣赏和敬畏的心态。这带给围棋界很大的冲击,以前大家认为正确的东西,其实是不正确的。
  柯洁曾经评价说:“AlphaGo 出现,很多理论都被推翻,再看以前定式变得好笑,亏那么多目就不再是两分。”人类通过数千年实战,总结了围棋理论,然后计算机告诉人类:这些全都是错的。现在在很多比赛上,人类棋手已经开始向机器学习,模仿 AlphaGo 的下法,棋圣聂卫平也曾表示“理论被颠覆了”。
  而 AlphaGo2.0 脫离了机器对人模仿,走棋风格也将完全脱离人的定式。在与柯洁的比赛中,会不断出现我们意想不到的走棋,而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻,但凡一个正常的棋手都不会这么玩,但凡一个新手这么玩都会被点拨这样不对。
  而 AlphaGo2.0 会不断制造这样的局面,关键他还是对的。可想对专业棋手的心理会有多大的震撼:不仅自己这一辈子都没这么想过这么下棋,整个围棋界都没有想过。会不会怀疑自己白活了?会不会反思两千年围棋的发展为什么有这样的瓶颈?还有多少海阔天空等着我们去探索?可等不及我们去探索,计算机就给出了终局的答案,多么惆怅。
  我们会津津乐道,AlphaGo 是什么棋风。但可以这样推理:但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0 便会是这么一台机器,没有风格,稳如磐石。
  可以想见这次与柯洁的对弈,能频现“怪招”,完全颠覆人类对围棋的理解——这会是比赛最大的看点。英勇的柯洁,要解锁 108 种姿势来抵挡了。
  2017 人机大战的意义:重演一部进化史,重新认识智慧的边界
  2016 年在 AlphaGo 和李世石的对战后,人工智能进入大众的视野,我们开始重新思考机器和人的关系。
  围棋已经有两千多年的历史,在漫长岁月的琢磨中,围棋理论不断进化,到达了很高的水准,AlphaGo 的获胜,我们大可以解读于“青出于蓝”,毕竟是在人类围棋进化的主路径上又攀高峰。
  而 AlphaGo2.0 完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。
  这会给我们什么启示?如果跳出围棋的规则,类比看地球生命的进化:人类是从原始的有机物,到单细胞开始逐步变成灵长类动物,并且发展出超越其他一切生物的智慧。这条路径是唯一的么?人类的生命形态和最顶级的生命形态还有多大距离?AlphaGo 告诉我们:我们还有极大的发展空间,AlphaGo2.0 告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。
  让我们欢呼人的智慧造就了 AlphaGo,这也帮我们开了眼界,看到我们离最终的生命形态和智慧依然有遥远的距离。
  保持敬畏,坚定前行,终得圆满。
其他文献
俄罗斯,远东大陆上最神奇的国度。战斗民族不但能徒手撕狗熊、醉卧冰雪地,更是传说中能影响世界格局的黑客专家。  俄罗斯黑客做过什么?往大了说,美国大选、法国大选、德国大选、曝光奥运选手用药、入侵纳斯达克、2015年中国股灾等等事件都与其有着脱不开的关系。往小了说,破解第一版Windows XP、泄露守望先锋新英雄这些事都是他们干的。据说如果在暗网上寻求黑客服务,价格会被分为“黑客”和“俄罗斯黑客”两
期刊
【价值综合】易到没能全面兑现“5月彻底解决司机提现问题”的承诺。  5月31日,有平台爆料称,因易到在规定的5月底期限内无法解决司机体现问题,司机到易到公司讨要说法。对此,易到发声明称,公司将于2017年6月29日全面开放线上提现。届时,易到在全国范围内的注册司机,均可通过易到APP完成提现。  易到方面表示,对于延误部分司机提现,“我司深感不安、深表歉意。”易到方面称,公司正有序推进融资事宜,目
期刊
2015年移动互联网创新大会(Mobile Internet Innovation Conference,MIIC)的主题是“新生代”,我们把焦点放在所有的变量公司上,他们是新一代移动互联网领袖,也是传统公司中率先变革的那一拨人。  我们试图从这拨儿最有创造力的人的头脑中回答:当互联网、新技术如同一把利剑无往不破,更成为一种信念开始长驱直入传统企业,这股力量从何而来?企业和人在新趋势下何去何从? 
期刊
在谷歌无人驾驶独立公司Waymo轮番的司法施压之下,Uber似乎有些扛不住了。  据《纽约时报》周二报道,美国打车服务Uber已经解聘了安东尼-莱万多斯基(Anthony Levandowski),他是该公司与谷歌旗下Waymo部门之间司法“战争”的中心人物,也是Uber的技术副总裁,负责Uber无人驾驶汽车研发。  莱万多斯基此前供职于谷歌,曾在多年时间里参与谷歌的无人驾驶汽车项目,也就是现在的
期刊
人,说到底,要靠股权跟公司连接起来。首先遇到的是股权怎么办的问题,所以,我们主张当创业团队运行一段时间之后,如果发现初始的股权分配不科学、不合理,创业团队应该坐下来心平气和地重新讨论股权分配模式。  关于公司股东离职以后股权的回收,实际上可以在创业初期的股权分配协议当中明确的予以约定,并且可以事先确定回购价格,事实上这个条款是事先锁定未来类似风险的条款。  分股权的时候,5:5或者3:3:3的模式
期刊
“你见过10年前的豪车吗?你要是回到十年前打开那些奔驰宝马的车门一看,一定会觉得low。可现在的办公室和十年前的办公室比呢?没什么区别——都是格子间。”说这番话的人是梦想加的联合创始人王晓鲁,那天下午他们刚刚宣布完成了2000万美元的融资,工作人员正带着媒体和投资人参观梦想加位于歌华大厦13层的新分店:“我们这开业2周就满租了”。  在经过去年联合办公们的一波倒闭合并潮之后,所有人都在好奇一件事,
期刊
多年来,投资者和董事心心念念的是公司每季度的利润,如今,他们苦苦寻找的领导者,是那些能快速决策,大胆出击,并带领公司抵御野心勃勃的初创公司的人。  简单的说就是,他们在寻找既能迅速抵御初创公司挑战,又能大手笔投资颠覆性科技的企业掌门人。  福特汽车公司最近炒了为公司效力28年的首席执行官马克·菲尔兹,成为美国大企业工作重心转变的最新实例。这个例子告诉我们一个简单的事实:在这个被软件和科技业迅速颠覆
期刊
人机大战最后一场比赛没有出现意外。比赛从上午10:30开始,一直激战至下午14:08,最终以柯洁投子认输结束。  今日比赛一开始,AlphaGo又一次将第一步棋下在自己的右下角,在前天的第二局比赛中AlphaGo也是将第一步棋下在自己的右下角。但按照人类习惯,黑棋第一步应该走自己的右上角,以表示对对手的尊敬。  Deepmind创始人Demis Hassabis在25日赛后对此表示抱歉,称因为 A
期刊
最近,王自如对华为P10的测评视频引来网友的不少热议,知乎上,对他和ZEALER的批判已经是毫不留情面了,正如有人调侃:“王自如用一期视频洗白了华为P10,也洗清了自己跟雷军的关系”。只能说王自如现在的测评似乎已经缺乏信服力了。  我们都知道,华为P10的混用闪存事件给华为手机带来不少的争议,让许多消费者感到失望,也对整个华为P系列产品的声誉都产生不小的创伤。那么针对此次事件,一向客观公正的王自如
期刊
7月2日晚上,优酷土豆集团CEO古永锵正在为电视剧版《小时代》发布会做准备,还是穿橙色衬衫,是他这两年里在公开场合出现的时候最常见的穿着,上衣非蓝即橙,分别代表着优酷和土豆。  采访开始之前,古永锵向大家展示手机里7岁儿子的照片。现在古永锵更注意养生,更多陪家人,周末会陪儿子踢球。在优酷总裁魏明和土豆总裁杨伟东分别带领各自团队之后,古永锵则更专注于产品、内容的整体方向发展,许多的具体业务都放手给相
期刊