论文部分内容阅读
如果说2015年10月AlphaGo打败欧洲围棋冠军樊麾时,人类还心存侥幸,那么随着今年3月AlphaGo以4:1的悬殊比分战胜世界围棋冠军李世石,人类的信心则已严重受挫。
人工智能已经超过人类了吗?这个问题突然变得复杂起来。想象那一天真的到来,人工智能完全超越了人类,地球上的碳基生命将何去何从?在最乐观的那条时间线上,品质和智能都超越人类的A.I.,愿意无私地帮助人类更美好地生存下去,那么,那时的人类是否还需要智能?
对于这个问题,有些人似乎已经比其他人更早地考虑到了。那个试图发明作弊机的龙宇清就是其中一个。
糖匪,素人幻想师,《不存在日报》主编。生于404,not found。好奇心强烈,热爱捕捉与被捕捉。作品有《八月风灯》《面孔》《看见鲸鱼座的人》。
一
“这不是在抄袭吗?”
“不是。对于喜欢学习的人,我给他答案,他会拿去逆向推导整个过程,搞清楚题目。”
“那对不想学习的人呢?”
“给他答案,他就不必勉强学习,用节约下来的时间去做他喜欢的事情,整个社会都会变得更有效率。”
用手机扫一下某道学习题,就能立即得出这道问题的答案——龙宇清致力于编写这样一个程序,用来帮助学生学习。直接给答案不就是等同于帮助抄袭吗?面对我的质疑,龙宇清给出了“社会效率说”。
我的三观瞬间摇晃起来。从小到大受到的正统教育在不远处虚弱地咳个不停。很难全盘否定面前这个年轻人的话,尤其他设计的程序听起来还很酷。
龙宇清,剑桥大学辍学生。这个答案也许太粗暴。如果这是一个方程式,如果在“龙宇清”这个名字后面画一个等号,那等号的另一边还可以是青年创业家、London Dreamcatchers Day最年轻演讲嘉宾、 斯坦福数学竞赛铜牌(SMT)、哈佛MIT数学竞赛第七名,以及迪拜家族和英国Highmoor家族的私人家教。这些头衔之间应该用连等号,还是加号,或者乘号——不同的运算符合将决定最后得到的那个数值,一个可以被量化的龙宇清。但是不着急,他足够年轻,冲劲十足。脑子里有无数想法。
假如愿意,还可以在那个等号后面加上更多的头衔。
比如,作弊机发明者。
我们是在APEX创新者大会的一场讲座上认识的。那个讲座的主题恰好是“学习的革命”。演讲者在台上展望未来远程学习的同时,我们在下面热烈交流着如何在互联网上帮助学生解答问题。如果以作业一定要独立思考完成为原则,那么你可以将他正试图编写的程序叫作“作弊程序”,也可以简单粗暴地将帮助学生回答问题的手机,称为作弊机。
和任何人类创造的科技一样,新科技是否作恶,取决于最终怎样应用。如果仅在回答作业,而不是考试时使用,龙宇清正在编写的程序无疑对学习者和教育者来说都具有正面意义。
“国内目前其实有一些网站和APP是以帮助学生解题为目的而建的,但他们的工作原理只是雇人人工在线答题,不是通过算法让机器回答。”龙宇清透露。
我花了一秒钟想象这个场景,“呃,这不是和淘宝上的客服一样吗?”
“是的。”他笑着回答道。
龙宇清还告诉我关于他所说的答题程序,并不是他一个人的创想。此刻,许多心怀梦想的极客正在世界各个角落为如何编写这个程序而冥思苦想着。
要知道,这个程序一旦实现,不仅可以帮助学习,更是人机互联的一个巨大突破。这款程序如果要成功,必须完成计算机的代码嫁接、计算机的自学,以及自我运行。其中计算机的自主学习尤为关键。目前看来,通过输入题目答案使计算机帮助解题并不可行。没有学习能力的计算机即便输入海量题目,即便拥有足够强大的计算能力,即便不考虑便携性和操作性,也无法应对日益变化的题型和考试内容,甚至无法很好地理解题目内容。只有通过让计算机拥有自主学习能力从而掌握学科知识,考试要求,并对相应题型大致归类,才可能实现帮助解题的目的。
简而言之,没有学习能力的计算机,无法帮助人类学习。
那么问题来了。现阶段,计算机学习能力进展到哪一步了?
二
说到机器学习,就不可能绕开“深度学习”这四个字。
无论是以压倒性优势打败世界围棋冠军职业九段选手李世石的AlphaGo,还是Facebook家的围棋A.I.——“黑暗森林”,都是在深度学习这一算法上开展的。
深度学习是机器学习领域中的一种算法。它能模拟人脑神经元的工作方式,建造机器神经网络。具有深度学习能力的计算机网络能够收集、处理并分析庞大的数据,最终通过自主学习来实现图像和语音识别等智能行为。2012年,Google大脑团队开发出的人工神经网络利用深度学习算法,通过观看一周YouTube视频自主学会了识别哪些是关于猫的视频。虽然该算法基于人工神经科学研究,并应用于许多复杂的数学模型,但是,深度学习算法仍是比人脑简单得多的软件。有人会将深度学习比喻为卡通大脑,但随着技术不断发展,这个比喻是否成立将越来越变得可疑。
近期,谷歌的DeepMind团队开发的一款教会自己打十几款经典街机游戏的软件,使用分布式深度递归网络(DDRON)解开了著名的红蓝帽子谜题:一百名囚犯依次排队,每人戴一顶蓝帽子或者红帽子,每人都可以看到前面所有人的帽子,但看不到自己以及后面的帽子。从队尾开始,狱警要问每个囚犯自己帽子的颜色。在排队前,囚犯们获准可以一起商量,设计出一套回答问题的方案。为了破题,DeepMind的这款软件把每个囚犯塑造成一个独立的智能代理,每个个体都知道自己能看见的帽子颜色,各自决定怎么告诉别人,然后再使用共同的信息得出答案。一开始,所有代理都没有获得任何实现设定的通信协议,但每个代理都能够学会解决基于通信的协作任务。因此,为成功地通信,首先必须自动开发出他们自己的通信协议并在相互间达成一致。最后,成功解决问题。 红蓝帽子谜题的破解,是深度学习成功学会通信协议的第一个案例。这是向人工智能之间的沟通和协作跨出的第一步。从长远来看,这会给人工智能增加更多扩展性,并允许它们解决以前无法解决的问题。
除了深度学习的算法,其他计算机算法也是基于类似动物神经元,可相互分享数据并作出计算的算法。今天的神经网络实质上还是使用二十世纪八十年代初期的算法。学习识别一个物体,计算机可能首先需要成千上万张带有标签的样本,还需要进行监督式的教导,而人类只需要少量样本且可能不需要监督。
相比人工神经网络信息单向的工作方式,大脑则完全不同。人类大脑由许多神经元构成,这些小单元可以通过巨大的电脉冲网络互相发送信息,这些信息调控所有由大脑控制的身体功能,包括理解场景和肢体运动等。大脑神经元高度相连,每一步处理过程都可能产生反馈。但到目前为止,科学家还未能完全理解神经元的工作机制。
也就是说,如果能更好地理解神经元的工作机制,提高对大脑计算原理的认识,将原理运用到人工智能的自主学习上,就可能实现人工智能机器在不需要监督的环境下通过少量样本进行学习。这正是人工智能的标志。
为了更好地理解生物神经网络和反馈回路 ,科学家Sandra Kuhlman 将使用双光子钙成像显微镜技术,来记录上万个小鼠神经元处理视觉信息时所产生的信号。科学家首先在小鼠脑内加入钙染料或者能感受钙离子浓度变化的蛋白;利用神经细胞被激活,细胞钙水平发生变化的原理,根据钙水平来判断神经元的激活状态。当一个神经细胞被激活时,随着荧光爆发就能实时观察神经细胞及其发生的反应。
记录下的数据将用于建造一个互连神经元模型。通过将分子传感器与光学方法整合起来,检测神经活动,可能可以实现追踪一个大脑区域内神经元的大部分神经动态,由此得到一个巨大的数据集,将帮助人类详细认识视觉皮层某个区域中神经元的行为。研究人员希望使用这个大规模数据集解开神经网络的复杂难题。他们的目标是将获得的新知识应用到机器学习算法上,使他们可以使用少得多的样本就能开发出模型。
三
以上种种,都向我们展现了人工智能研究领域的美好前景。一旦人类写出更高效的机器学习算法,人工智能将势不可挡,而人工智能威胁论也将不单单是对未来世界的忧心。
但事情似乎并不完全是那个样子。人工智能似乎会在意想不到的时候展现他蠢萌的一面。就以Watson为例吧。
IBM的人工智能问答机器Wason由90台IBM服务器和360个计算机芯片驱动组成,是一个有10台普通冰箱那么大的计算机系统。在2011年美国的智力竞赛节目《危险边缘》中,Wason成功打败了其他两位史上最成功的选手。2012年,Watson进入医学院,按照当时《纽约时报》的说法,Watson在克利夫兰医学院开始了它的医学生涯。
如今,Watson已经被运用到超过三十五个国家十七个产业领域。例如,在医疗保健方面,它可以作为一种线上工具协助医疗专家进行疾病的诊断。医生可以输入一系列的症状和病史,基于Watson的诊断反馈,来做出最终的诊断并制订相关的治疗计划。在其他领域,Watson也大显身手,不负众望,满足了人类对它这样一个人工智能的一般期望。
然而看起来很厉害的Watson同学,却拒绝参加美国普通八年级(相当于中国的初二水平)的科学考试。
这次考试源于艾伦人工智能研究所举办的一次竞赛。该竞赛邀请世界各地的程序员开发一个能够参加美国普通八年级科学考试的程序。竞赛优胜者哈依姆·林哈尔特开发的程序得到的分数,是本次考试的最高分——59%的正确率。哈依姆将多项机器学习技术和大型科学信息数据库结合在一起,向计算机系统输入了上千的问题及对应答案,以便计算机系统能学会生成正确答案。虽然人工智能在识别图片和语音等任务上取得与人类水平相近的成果,但是,我们依然无法建造出像人一样思考的机器和能真正对话的A.I.,甚至没法建造出能通过初中考试的系统。科学考试题要求学生在面对多个概念的复杂问题时,通过若干个步骤来解决问题,测试者必须把多个事实组合在一起,才能获得正解。对现在的人工智能来说,科学考试比问答节目难度更大。
从这点来看,也多少可以猜测出Watson为什么会拒绝参加这个明明可以让它一试身手的比赛。按照比赛组织方的说法:“如果大型公司参加比赛,也许会拿到更高的分数。但是群体智慧也很强大。这次比赛的很多参与者都极具天赋。大多数比赛中的获奖模型也都是非常适合测试数据集的。所以,即使是同一个领域内的公司也不一定具有显著优势。”换而言之,即使Watson来,也未必能在这场八年级科学考试中拿到多高的分数。
但是IBM也有他们的说法。他们说Watson的焦点已经不在这样的比赛,而是转向真实世界的应用,比如Watson现如今在临床医学以及其他各个领域上应用,的确在很好地帮助人类走进更美好的未来。焦点不在考试,这话无论对于人工智能还是对于人类,都同样有效。
所以你看,等到将来的某天,像龙宇清这样的极客真的编写出通过自主学习帮人答题的程序,真的创造出所谓的作弊机,你也许会发现——
答案并不重要,过程至关紧要。到头来,这仿佛是一个关于生命的终极比喻。生为人类,我们都知道生命尽头只有一个统一答案。但是,如何度过这一生才是问题的关键。
(上期专栏登出的刘慈欣老师新作,来自《不存在日报》科幻春晚接龙《宇宙尽头的眼睛》。整台春晚的完整版电子书现已上传豆瓣阅读平台,在豆瓣阅读搜索“未来事务管理局”或《宇宙尽头的眼睛》即可免费领取。)
人工智能已经超过人类了吗?这个问题突然变得复杂起来。想象那一天真的到来,人工智能完全超越了人类,地球上的碳基生命将何去何从?在最乐观的那条时间线上,品质和智能都超越人类的A.I.,愿意无私地帮助人类更美好地生存下去,那么,那时的人类是否还需要智能?
对于这个问题,有些人似乎已经比其他人更早地考虑到了。那个试图发明作弊机的龙宇清就是其中一个。
糖匪,素人幻想师,《不存在日报》主编。生于404,not found。好奇心强烈,热爱捕捉与被捕捉。作品有《八月风灯》《面孔》《看见鲸鱼座的人》。
一
“这不是在抄袭吗?”
“不是。对于喜欢学习的人,我给他答案,他会拿去逆向推导整个过程,搞清楚题目。”
“那对不想学习的人呢?”
“给他答案,他就不必勉强学习,用节约下来的时间去做他喜欢的事情,整个社会都会变得更有效率。”
用手机扫一下某道学习题,就能立即得出这道问题的答案——龙宇清致力于编写这样一个程序,用来帮助学生学习。直接给答案不就是等同于帮助抄袭吗?面对我的质疑,龙宇清给出了“社会效率说”。
我的三观瞬间摇晃起来。从小到大受到的正统教育在不远处虚弱地咳个不停。很难全盘否定面前这个年轻人的话,尤其他设计的程序听起来还很酷。
龙宇清,剑桥大学辍学生。这个答案也许太粗暴。如果这是一个方程式,如果在“龙宇清”这个名字后面画一个等号,那等号的另一边还可以是青年创业家、London Dreamcatchers Day最年轻演讲嘉宾、 斯坦福数学竞赛铜牌(SMT)、哈佛MIT数学竞赛第七名,以及迪拜家族和英国Highmoor家族的私人家教。这些头衔之间应该用连等号,还是加号,或者乘号——不同的运算符合将决定最后得到的那个数值,一个可以被量化的龙宇清。但是不着急,他足够年轻,冲劲十足。脑子里有无数想法。
假如愿意,还可以在那个等号后面加上更多的头衔。
比如,作弊机发明者。
我们是在APEX创新者大会的一场讲座上认识的。那个讲座的主题恰好是“学习的革命”。演讲者在台上展望未来远程学习的同时,我们在下面热烈交流着如何在互联网上帮助学生解答问题。如果以作业一定要独立思考完成为原则,那么你可以将他正试图编写的程序叫作“作弊程序”,也可以简单粗暴地将帮助学生回答问题的手机,称为作弊机。
和任何人类创造的科技一样,新科技是否作恶,取决于最终怎样应用。如果仅在回答作业,而不是考试时使用,龙宇清正在编写的程序无疑对学习者和教育者来说都具有正面意义。
“国内目前其实有一些网站和APP是以帮助学生解题为目的而建的,但他们的工作原理只是雇人人工在线答题,不是通过算法让机器回答。”龙宇清透露。
我花了一秒钟想象这个场景,“呃,这不是和淘宝上的客服一样吗?”
“是的。”他笑着回答道。
龙宇清还告诉我关于他所说的答题程序,并不是他一个人的创想。此刻,许多心怀梦想的极客正在世界各个角落为如何编写这个程序而冥思苦想着。
要知道,这个程序一旦实现,不仅可以帮助学习,更是人机互联的一个巨大突破。这款程序如果要成功,必须完成计算机的代码嫁接、计算机的自学,以及自我运行。其中计算机的自主学习尤为关键。目前看来,通过输入题目答案使计算机帮助解题并不可行。没有学习能力的计算机即便输入海量题目,即便拥有足够强大的计算能力,即便不考虑便携性和操作性,也无法应对日益变化的题型和考试内容,甚至无法很好地理解题目内容。只有通过让计算机拥有自主学习能力从而掌握学科知识,考试要求,并对相应题型大致归类,才可能实现帮助解题的目的。
简而言之,没有学习能力的计算机,无法帮助人类学习。
那么问题来了。现阶段,计算机学习能力进展到哪一步了?
二
说到机器学习,就不可能绕开“深度学习”这四个字。
无论是以压倒性优势打败世界围棋冠军职业九段选手李世石的AlphaGo,还是Facebook家的围棋A.I.——“黑暗森林”,都是在深度学习这一算法上开展的。
深度学习是机器学习领域中的一种算法。它能模拟人脑神经元的工作方式,建造机器神经网络。具有深度学习能力的计算机网络能够收集、处理并分析庞大的数据,最终通过自主学习来实现图像和语音识别等智能行为。2012年,Google大脑团队开发出的人工神经网络利用深度学习算法,通过观看一周YouTube视频自主学会了识别哪些是关于猫的视频。虽然该算法基于人工神经科学研究,并应用于许多复杂的数学模型,但是,深度学习算法仍是比人脑简单得多的软件。有人会将深度学习比喻为卡通大脑,但随着技术不断发展,这个比喻是否成立将越来越变得可疑。
近期,谷歌的DeepMind团队开发的一款教会自己打十几款经典街机游戏的软件,使用分布式深度递归网络(DDRON)解开了著名的红蓝帽子谜题:一百名囚犯依次排队,每人戴一顶蓝帽子或者红帽子,每人都可以看到前面所有人的帽子,但看不到自己以及后面的帽子。从队尾开始,狱警要问每个囚犯自己帽子的颜色。在排队前,囚犯们获准可以一起商量,设计出一套回答问题的方案。为了破题,DeepMind的这款软件把每个囚犯塑造成一个独立的智能代理,每个个体都知道自己能看见的帽子颜色,各自决定怎么告诉别人,然后再使用共同的信息得出答案。一开始,所有代理都没有获得任何实现设定的通信协议,但每个代理都能够学会解决基于通信的协作任务。因此,为成功地通信,首先必须自动开发出他们自己的通信协议并在相互间达成一致。最后,成功解决问题。 红蓝帽子谜题的破解,是深度学习成功学会通信协议的第一个案例。这是向人工智能之间的沟通和协作跨出的第一步。从长远来看,这会给人工智能增加更多扩展性,并允许它们解决以前无法解决的问题。
除了深度学习的算法,其他计算机算法也是基于类似动物神经元,可相互分享数据并作出计算的算法。今天的神经网络实质上还是使用二十世纪八十年代初期的算法。学习识别一个物体,计算机可能首先需要成千上万张带有标签的样本,还需要进行监督式的教导,而人类只需要少量样本且可能不需要监督。
相比人工神经网络信息单向的工作方式,大脑则完全不同。人类大脑由许多神经元构成,这些小单元可以通过巨大的电脉冲网络互相发送信息,这些信息调控所有由大脑控制的身体功能,包括理解场景和肢体运动等。大脑神经元高度相连,每一步处理过程都可能产生反馈。但到目前为止,科学家还未能完全理解神经元的工作机制。
也就是说,如果能更好地理解神经元的工作机制,提高对大脑计算原理的认识,将原理运用到人工智能的自主学习上,就可能实现人工智能机器在不需要监督的环境下通过少量样本进行学习。这正是人工智能的标志。
为了更好地理解生物神经网络和反馈回路 ,科学家Sandra Kuhlman 将使用双光子钙成像显微镜技术,来记录上万个小鼠神经元处理视觉信息时所产生的信号。科学家首先在小鼠脑内加入钙染料或者能感受钙离子浓度变化的蛋白;利用神经细胞被激活,细胞钙水平发生变化的原理,根据钙水平来判断神经元的激活状态。当一个神经细胞被激活时,随着荧光爆发就能实时观察神经细胞及其发生的反应。
记录下的数据将用于建造一个互连神经元模型。通过将分子传感器与光学方法整合起来,检测神经活动,可能可以实现追踪一个大脑区域内神经元的大部分神经动态,由此得到一个巨大的数据集,将帮助人类详细认识视觉皮层某个区域中神经元的行为。研究人员希望使用这个大规模数据集解开神经网络的复杂难题。他们的目标是将获得的新知识应用到机器学习算法上,使他们可以使用少得多的样本就能开发出模型。
三
以上种种,都向我们展现了人工智能研究领域的美好前景。一旦人类写出更高效的机器学习算法,人工智能将势不可挡,而人工智能威胁论也将不单单是对未来世界的忧心。
但事情似乎并不完全是那个样子。人工智能似乎会在意想不到的时候展现他蠢萌的一面。就以Watson为例吧。
IBM的人工智能问答机器Wason由90台IBM服务器和360个计算机芯片驱动组成,是一个有10台普通冰箱那么大的计算机系统。在2011年美国的智力竞赛节目《危险边缘》中,Wason成功打败了其他两位史上最成功的选手。2012年,Watson进入医学院,按照当时《纽约时报》的说法,Watson在克利夫兰医学院开始了它的医学生涯。
如今,Watson已经被运用到超过三十五个国家十七个产业领域。例如,在医疗保健方面,它可以作为一种线上工具协助医疗专家进行疾病的诊断。医生可以输入一系列的症状和病史,基于Watson的诊断反馈,来做出最终的诊断并制订相关的治疗计划。在其他领域,Watson也大显身手,不负众望,满足了人类对它这样一个人工智能的一般期望。
然而看起来很厉害的Watson同学,却拒绝参加美国普通八年级(相当于中国的初二水平)的科学考试。
这次考试源于艾伦人工智能研究所举办的一次竞赛。该竞赛邀请世界各地的程序员开发一个能够参加美国普通八年级科学考试的程序。竞赛优胜者哈依姆·林哈尔特开发的程序得到的分数,是本次考试的最高分——59%的正确率。哈依姆将多项机器学习技术和大型科学信息数据库结合在一起,向计算机系统输入了上千的问题及对应答案,以便计算机系统能学会生成正确答案。虽然人工智能在识别图片和语音等任务上取得与人类水平相近的成果,但是,我们依然无法建造出像人一样思考的机器和能真正对话的A.I.,甚至没法建造出能通过初中考试的系统。科学考试题要求学生在面对多个概念的复杂问题时,通过若干个步骤来解决问题,测试者必须把多个事实组合在一起,才能获得正解。对现在的人工智能来说,科学考试比问答节目难度更大。
从这点来看,也多少可以猜测出Watson为什么会拒绝参加这个明明可以让它一试身手的比赛。按照比赛组织方的说法:“如果大型公司参加比赛,也许会拿到更高的分数。但是群体智慧也很强大。这次比赛的很多参与者都极具天赋。大多数比赛中的获奖模型也都是非常适合测试数据集的。所以,即使是同一个领域内的公司也不一定具有显著优势。”换而言之,即使Watson来,也未必能在这场八年级科学考试中拿到多高的分数。
但是IBM也有他们的说法。他们说Watson的焦点已经不在这样的比赛,而是转向真实世界的应用,比如Watson现如今在临床医学以及其他各个领域上应用,的确在很好地帮助人类走进更美好的未来。焦点不在考试,这话无论对于人工智能还是对于人类,都同样有效。
所以你看,等到将来的某天,像龙宇清这样的极客真的编写出通过自主学习帮人答题的程序,真的创造出所谓的作弊机,你也许会发现——
答案并不重要,过程至关紧要。到头来,这仿佛是一个关于生命的终极比喻。生为人类,我们都知道生命尽头只有一个统一答案。但是,如何度过这一生才是问题的关键。
(上期专栏登出的刘慈欣老师新作,来自《不存在日报》科幻春晚接龙《宇宙尽头的眼睛》。整台春晚的完整版电子书现已上传豆瓣阅读平台,在豆瓣阅读搜索“未来事务管理局”或《宇宙尽头的眼睛》即可免费领取。)