王小川谈人机大战：重演了一部进化史，重新认识智慧的边界

来源 :商业价值 | 被引量 : 0次 | 上传用户：samxustyle

【摘要】

：

【出处】

：

商业价值

【发表日期】

：

2017年3期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　AlphaGo三番棋对决中的第二盘昨日打响，最终柯洁不敌阿尔法围棋，第二盘告负，目前双方比分0：2。
　　随后搜狗公司CEO王小川在知乎上发布评论文章称，2017人机大战的意义在于它重演一部进化史，重新认识智慧的边界。王小川表示，“AlphaGo2.0 告诉我们：如果有合适的条件，完全可能有其他的生命进化路径，以及更不一样的进化结果。”
　　王小川认为，AlphaGo 2.0与1.0已大不相同，新的算法对计算资源开销极小，把当前棋局输入神经网络，电流流过，输出就是最佳的走棋方案。王小川猜测，有可能仅仅依靠一个 GPU 工作，每一步棋消耗的能源接近人的大脑。
　　在王小川看来， AlphaGo2.0已经完全抛弃掉人类这两千年来进化的围棋经验，另寻他径，仅凭两台机器自我对弈中学习和进化，最终不仅赶超了人类进化的速度，还发展出一套截然不同的下棋方法，并且更加接近完美的状态，实现了对人类的碾压，重演了一部围棋的进化史，而且得出了与这两千年来不同的进化结果。
　　附王小川评论全文：
　　该来的终于来了。
　　一年前 AlphaGo 发布，看完论文后我就在知乎上发文预测机器会完胜人类。好些行业朋友不相信，为此我收了很多“智商税”，之后微信发红包一直发到春节才发完。此外我还立了两个断言：一个是 Google 很有可能再研发出 AlphaGo 2.0，摆脱“监督学习”，不再需要人类下围棋的历史数据，而是只通过“增强学习”，两台 AlphaGo 自我对战学习如何下棋，并达到登峰造极的地步。从公开的资料判断，此言中了。这意味着什么呢，又有什么看点呢？
　　技术重大提升：和 1.0 原理大不同，更接近于人
　　AlphaGo 1.0 是巧妙地混合了三种算法：蒙特卡洛树搜索 + 监督学习 + 增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算，比 1997 年深蓝的暴力计算更聪明。而这里的监督学习，是通过学习 3000 万步人类棋谱，对六段以上职业棋手走棋规律进行模仿，也是 AlphaGo 获得突破性进展的关键算法。而增强学习作为辅助，是两台 AlphaGo 从自我对战众中学习如何下棋，据悉对棋力提升有限。
　　根据公开资料推测，此次 AlphaGo2.0 的技术原理与之前有着巨大不同：
　　1. 放弃了监督学习，没有再用人的 3000 万局棋谱进行训练。这本是 AlphaGo 最亮眼的算法，也是今天主流机器学习不可避免的核心条件：依赖于优质的数据，在这个特定问题下就这么被再次突破了。
　　2. 放弃了蒙特卡洛树搜索，不再进行暴力计算。理论上，算法越笨，就越需要暴力计算做补充。算法越聪明，就可以大大减少暴力计算。从 AlphaGo 2.0 的“马甲”Master 的历史行为看，走棋非常迅速，约在每 10 秒钟就走棋一步，如此速度很可能是放弃了暴力的计算。
　　3. 极大地强化了增强学习的作用，之前敲边鼓的算法，正式成为扛把子主力。想想看有多励志：两台白痴机器，遵守走棋和获胜规则，从随机走棋开始日夜切磋，总结经验，不断批评和自我批评，一周后终成大器。
　　在这样的算法下，AlphaGo 2.0 对计算资源开销极小，把当前棋局输入神经网络，电流流过，输出就是最佳的走棋方案。我猜测如此算法下，有可能仅仅依靠一个 GPU 工作，每一步棋消耗的能源接近人的大脑。
　　最大看点： AlphaGo2.0 棋风完全脱离人类经验
　　今年年初，AlphaGo 化身 Master 连胜人类顶尖棋手 60 局。在围棋领域，机器完胜已经变成公认的定论。这导致很多人开始问：这次人机大战还有意义吗？我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。
　　AlphaGo 学习了 3000 万步人类棋谱，走棋风格也近似于人。在比赛现场，偶有 AlphaGo 走棋和人的经验不符合，就被评为“愚蠢”，只是在中盘之后发现机器渐渐局面占优最终获胜，为了自圆其说解读为“AlphaGo 中盘逆转”，前两局莫过如此。第三局开始评论者长了教训，开始尊称 AlphaGo 为“阿老师”，有了欣赏和敬畏的心态。这带给围棋界很大的冲击，以前大家认为正确的东西，其实是不正确的。
　　柯洁曾经评价说：“AlphaGo 出现，很多理论都被推翻，再看以前定式变得好笑，亏那么多目就不再是两分。”人类通过数千年实战，总结了围棋理论，然后计算机告诉人类：这些全都是错的。现在在很多比赛上，人类棋手已经开始向机器学习，模仿 AlphaGo 的下法，棋圣聂卫平也曾表示“理论被颠覆了”。
　　而 AlphaGo2.0 脫离了机器对人模仿，走棋风格也将完全脱离人的定式。在与柯洁的比赛中，会不断出现我们意想不到的走棋，而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻，但凡一个正常的棋手都不会这么玩，但凡一个新手这么玩都会被点拨这样不对。
　　而 AlphaGo2.0 会不断制造这样的局面，关键他还是对的。可想对专业棋手的心理会有多大的震撼：不仅自己这一辈子都没这么想过这么下棋，整个围棋界都没有想过。会不会怀疑自己白活了？会不会反思两千年围棋的发展为什么有这样的瓶颈？还有多少海阔天空等着我们去探索？可等不及我们去探索，计算机就给出了终局的答案，多么惆怅。
　　我们会津津乐道，AlphaGo 是什么棋风。但可以这样推理：但凡有流派和风格，就还有局限性。只有当所有流派合一看不出流派的时候，才到达致高境界。AlphaGo 2.0 便会是这么一台机器，没有风格，稳如磐石。
　　可以想见这次与柯洁的对弈，能频现“怪招”，完全颠覆人类对围棋的理解——这会是比赛最大的看点。英勇的柯洁，要解锁 108 种姿势来抵挡了。
　　2017 人机大战的意义：重演一部进化史，重新认识智慧的边界
　　2016 年在 AlphaGo 和李世石的对战后，人工智能进入大众的视野，我们开始重新思考机器和人的关系。
　　围棋已经有两千多年的历史，在漫长岁月的琢磨中，围棋理论不断进化，到达了很高的水准，AlphaGo 的获胜，我们大可以解读于“青出于蓝”，毕竟是在人类围棋进化的主路径上又攀高峰。
　　而 AlphaGo2.0 完全抛弃掉人类这两千年来进化的围棋经验，另寻他径，仅凭两台机器自我对弈中学习和进化，最终不仅赶超了人类进化的速度，还发展出一套截然不同的下棋方法，并且更加接近完美的状态，实现了对人类的碾压，重演了一部围棋的进化史，而且得出了与这两千年来不同的进化结果。
　　这会给我们什么启示？如果跳出围棋的规则，类比看地球生命的进化：人类是从原始的有机物，到单细胞开始逐步变成灵长类动物，并且发展出超越其他一切生物的智慧。这条路径是唯一的么？人类的生命形态和最顶级的生命形态还有多大距离？AlphaGo 告诉我们：我们还有极大的发展空间，AlphaGo2.0 告诉我们：如果有合适的条件，完全可能有其他的生命进化路径，以及更不一样的进化结果。
　　让我们欢呼人的智慧造就了 AlphaGo，这也帮我们开了眼界，看到我们离最终的生命形态和智慧依然有遥远的距离。
　　保持敬畏，坚定前行，终得圆满。

其他文献

为什么俄罗斯黑客这么厉害？

俄罗斯，远东大陆上最神奇的国度。战斗民族不但能徒手撕狗熊、醉卧冰雪地，更是传说中能影响世界格局的黑客专家。　　俄罗斯黑客做过什么？往大了说，美国大选、法国大选、德国大选、曝光奥运选手用药、入侵纳斯达克、2015年中国股灾等等事件都与其有着脱不开的关系。往小了说，破解第一版Windows XP、泄露守望先锋新英雄这些事都是他们干的。据说如果在暗网上寻求黑客服务，价格会被分为“黑客”和“俄罗斯黑客”两

期刊

易到未兑现5月提现承诺，再次延期至6月底 |价值早报

【价值综合】易到没能全面兑现“5月彻底解决司机提现问题”的承诺。　　5月31日，有平台爆料称，因易到在规定的5月底期限内无法解决司机体现问题，司机到易到公司讨要说法。对此，易到发声明称，公司将于2017年6月29日全面开放线上提现。届时，易到在全国范围内的注册司机，均可通过易到APP完成提现。　　易到方面表示，对于延误部分司机提现，“我司深感不安、深表歉意。”易到方面称，公司正有序推进融资事宜，目

期刊

新生代新思维

2015年移动互联网创新大会（Mobile Internet Innovation Conference，MIIC）的主题是“新生代”，我们把焦点放在所有的变量公司上，他们是新一代移动互联网领袖，也是传统公司中率先变革的那一拨人。　　我们试图从这拨儿最有创造力的人的头脑中回答：当互联网、新技术如同一把利剑无往不破，更成为一种信念开始长驱直入传统企业，这股力量从何而来？企业和人在新趋势下何去何从？　

期刊

Uber解聘无人驾驶负责人，为谷歌司法纠纷“关键”人物 | 价值早报

在谷歌无人驾驶独立公司Waymo轮番的司法施压之下，Uber似乎有些扛不住了。　　据《纽约时报》周二报道，美国打车服务Uber已经解聘了安东尼-莱万多斯基（Anthony Levandowski），他是该公司与谷歌旗下Waymo部门之间司法“战争”的中心人物，也是Uber的技术副总裁，负责Uber无人驾驶汽车研发。　　莱万多斯基此前供职于谷歌，曾在多年时间里参与谷歌的无人驾驶汽车项目，也就是现在的

期刊

蒋勇创业过程中的法律思维

人，说到底，要靠股权跟公司连接起来。首先遇到的是股权怎么办的问题，所以，我们主张当创业团队运行一段时间之后，如果发现初始的股权分配不科学、不合理，创业团队应该坐下来心平气和地重新讨论股权分配模式。　　关于公司股东离职以后股权的回收，实际上可以在创业初期的股权分配协议当中明确的予以约定，并且可以事先确定回购价格，事实上这个条款是事先锁定未来类似风险的条款。　　分股权的时候，5：5或者3：3：3的模式

期刊

拆了那些格子间，梦想加让你单纯地“享受办公服务”

“你见过10年前的豪车吗？你要是回到十年前打开那些奔驰宝马的车门一看，一定会觉得low。可现在的办公室和十年前的办公室比呢？没什么区别——都是格子间。”说这番话的人是梦想加的联合创始人王晓鲁，那天下午他们刚刚宣布完成了2000万美元的融资，工作人员正带着媒体和投资人参观梦想加位于歌华大厦13层的新分店：“我们这开业2周就满租了”。　　在经过去年联合办公们的一波倒闭合并潮之后，所有人都在好奇一件事，

期刊

华尔街正告诉CEO们：不能颠覆你的行业就走人

多年来，投资者和董事心心念念的是公司每季度的利润，如今，他们苦苦寻找的领导者，是那些能快速决策，大胆出击，并带领公司抵御野心勃勃的初创公司的人。　　简单的说就是，他们在寻找既能迅速抵御初创公司挑战，又能大手笔投资颠覆性科技的企业掌门人。　　福特汽车公司最近炒了为公司效力28年的首席执行官马克·菲尔兹，成为美国大企业工作重心转变的最新实例。这个例子告诉我们一个简单的事实：在这个被软件和科技业迅速颠覆

期刊

人机大战落帷，AlphaGo完胜柯洁

人机大战最后一场比赛没有出现意外。比赛从上午10：30开始，一直激战至下午14：08，最终以柯洁投子认输结束。　　今日比赛一开始，AlphaGo又一次将第一步棋下在自己的右下角，在前天的第二局比赛中AlphaGo也是将第一步棋下在自己的右下角。但按照人类习惯，黑棋第一步应该走自己的右上角，以表示对对手的尊敬。　　Deepmind创始人Demis Hassabis在25日赛后对此表示抱歉，称因为 A

期刊

王自如遭遇“洗地”风波，还有可信的第三方评测机构吗？

最近，王自如对华为P10的测评视频引来网友的不少热议，知乎上，对他和ZEALER的批判已经是毫不留情面了，正如有人调侃：“王自如用一期视频洗白了华为P10，也洗清了自己跟雷军的关系”。只能说王自如现在的测评似乎已经缺乏信服力了。　　我们都知道，华为P10的混用闪存事件给华为手机带来不少的争议，让许多消费者感到失望，也对整个华为P系列产品的声誉都产生不小的创伤。那么针对此次事件，一向客观公正的王自如

期刊

“过来人”古永锵

7月2日晚上，优酷土豆集团CEO古永锵正在为电视剧版《小时代》发布会做准备，还是穿橙色衬衫，是他这两年里在公开场合出现的时候最常见的穿着，上衣非蓝即橙，分别代表着优酷和土豆。　　采访开始之前，古永锵向大家展示手机里7岁儿子的照片。现在古永锵更注意养生，更多陪家人，周末会陪儿子踢球。在优酷总裁魏明和土豆总裁杨伟东分别带领各自团队之后，古永锵则更专注于产品、内容的整体方向发展，许多的具体业务都放手给相

期刊

王小川谈人机大战：重演了一部进化史，重新认识智慧的边界

其他学术论文