论文部分内容阅读
假如,有一天,在每个家庭,都有一个机器人,洗碗做饭,收拾房间,承担所有的家务;在每个公司,大部分工作都由机器人来做,人类可以完全摆脱苦力劳动。这样的未来,会不会对你很有吸引力?但要想进入这样一个梦想中的人工智能时代,我们得先教会机器学习。
让机器自我学习
就像每个人在获得技能前,必须经历过学习训练一样,机器要实现智能化,也只能通过学习。机器学习起源于人工智能的一个分支,在这一领域,计算机科学试图创造计算机的类人智慧。
真正的机器学习与我们所认为的传统编程有本质的不同。当提到电脑程序时(或者一个程序里用到的运算法则),我们一般会认为是工程师为电脑下达了一系列指令,告诉他们怎么样去处理一系列的输入,然后产生相应的输出。一个浏览器会跟踪被浏览的网页,然后对于用户的输入通过一种确定的可预料的方法进行回应。但这些都是由人类事先编码好的,而非机器主动学习的结果。
机器学习,就是机器自己编程,这些机器经过培训,也能像人类一样进行编程。谷歌公司2015年发布了一款名为“深梦”的图片识别应用软件,这款软件不仅可以识别图像,而且可以利用图像制造一些出人意料的奇幻景象。例如,你呈现一幅风景图时,软件会根据你的图片进行分析,输出一幅计算机眼中的风景图。
这是怎么做到的呢?谷歌深梦的运作原理是通过模拟人类的神经元网络,建立起计算机自己的神经网络系统,通过神经元获得物体的信息,从而进行分析。计算机的神经元网络系统包含了上千个互动的神经元,以实现数学上的精密运算。
当然,为了让机器能识别物体信息,在过去四年里,研究者们一直用大量图片训练电脑神经网络,例如给“深梦”软件看许多图片,并告诉每张图片中的主体是什么,一旦“深梦”从上百个角度看过上百个狗头一千次之后,它就能学会自己输出图像。
在实验中,“深梦”产生出了混合着鸟、眼睛和狗头轮廓的模糊图像,虽然它们并不那么栩栩如生,但是也揭示了电脑处理图像时的一种创造性,它已经不用人类监督指导地学会了识别小猫、小狗的脸。
神经网络的机器构造模仿了人类大脑,也充分发挥了计算机超强的记忆功能,在生活中有更普遍地应用。谷歌的搜索引擎、亚马逊的推荐目录、脸书的好友动态和垃圾邮件的过滤,还有军事、金融、科研、比人类驾车更靠谱的自动驾驶等重要工作,都是神经网络运作的具体应用。
今天,机器学习已经被成功地应用于更多领域,从检测信用卡交易欺诈的数据挖掘程序,到获取用户阅读兴趣的信息过滤系统,再到能在高速公路上自动行驶的汽车。可以说,我们的智能生活,都是机器学习的结果。
研究机器人学习的算法
机器学习能追溯到上世纪40年代二战结束前后,得益于战时交战双方的科学精英殚精竭虑,计算机理论在那一时期得到突飞猛进的发展。当时,控制论研究者们设想有一个神经元计算机模型,能够大致模拟生物神经元,并且可以用一种简洁和明确的数学形式来表示。
但是,面对一个不确定性和多样性的世界,人工预先制定的数学形式根本就难以应付。或者说,人工编程的世界,与现实的人类世界偏差太远,现实的世界不会那么有秩序和守规则。
例如,计算机预先以数学形式来表达马有四条腿,但这会产生两个问题。首先,电脑怎么样去学会理解这个事实;其次,对于那些因意外而失去了一条腿的马怎么办。这些看似是很愚蠢的问题,却是人工编程时遇到的最大障碍。这就是为什么至今搜索引擎还不能回答问题、仅仅能搜索关键词的原因所在。
但如果机器学习创造了自我编程系统,就可以对于他们自己的错误做出反应,并且不断更新他们的内部状态。人工编程中的漏洞在发布之前需要被检查出来,而机器学习的运算法则能在过程之中不断纠错,比人工智能更加灵活、有智慧。
但怎么能让机器学习呢?这就涉及到算法。可以说,算法是构建互联网的核心,现在许多网络搜索和沟通方式,都是基于设定好的数学公式构建起来的,比如谷歌搜索引擎、苹果语音系统、Facebook。在信息时代,我们的生活实际上是被一些数学公式引导着,在医学方面,已经有了公式能算出糖尿病和疟疾。今天,我们也在让学习公式的机器查看胸透时的X线量。
连接学习、符号推演法、贝叶斯学习、类比学习是4个当代计算机学习范式。其中,连接学习就是模仿人脑神经系统,建立起计算机人工神经网络;符号推演法就是将问题或知识表示成某种逻辑网络,采用符号推演的方法来学习;贝叶斯学习理论就是通过概率规则来实现学习和推理过程;类比学习就是通过对相似事物进行比较来学习。这4种学习范式还是过于复杂了,因此,华盛顿大学教授佩德罗·多明戈斯提供了一个更大胆的假设,即在未来,能将现有的算法公式统一成一个万能算法。
万能算法下的世界
多明戈斯构思了这样一个万能算法,它能将物理学、生物学上已经发现的理论和标准模型或者中心法则统一起来,同时,可以从数据中发现所有的知识,所有的人类现有的知识,也包括所有的未来的知识。例如,万能算法可以从第谷·布拉赫的太空观察中,推出牛顿定律,即使它没有相关的基础知识。
大脑皮层可能就是这样一个万能算法的典型例子。一些神经学家认为在所有领域,大脑皮层只用到了一个相同的公式,就能不断调整皮层下各级脑部及脊髓的机能,使他们能根据环境不断学习调整,听见、看见或者是弄懂周围世界的意思。
在信息时代,万能算法也将发挥类似大脑皮层的作用。它能在数据云的基础上,学习和利用信息,改变现在呆板的计算机被动执行模式,主动改进功能和完善输出,这将给人类信息生活带来革命性的转变。
例如,现在的网络信息量庞杂,打几个关键字,却得到了上百万网页,常常令人无法抉择。但有了万能算法,电脑将变成百科全书,只要问几个问题,就能很迅速地给出准确答案。
同时,今天的推荐系统也将得到彻底更新。现在,每个人会遇到许多的推荐信息。基于每个人留下的碎片化的数据,上百万个推荐系统每天会为你推荐不同的东西:暴风影音从你开始看他们的电影时,就为你推荐电影;亚马逊根据你买了什么和没买什么为你推荐书本;新浪会在你注册时推荐上百个兴趣群。但大多数人可能更需要的是一个更聪明的系统,能根据你上网产生的所有的数据和信息,来进行更具针对性的推荐服务。例如,它能在你生活的每个阶段推荐相应的东西,不仅是书和电影,还有房子、工作等。为了能达成这样的效果,首先就需要来自你日常生活所产生的数据,但另一方面,也需要万能算法,因为面对大量的数据,没有公式也无法处理这些数据。
假如真能成功找到万能算法,人工智能将真正实现。但对于未来这一智能图景,还是不免会让人担忧。比如,机器学习能够处理大多数的工作,世界将会有一个很大的失业群体,他们将怎么生存呢?会成为社会不稳定之源吗?假如人工智能被居心叵测的政治家们利用,世界还会太平吗?
对于这些问题,万能算法的倡导者佩德罗·多明戈斯并不担忧,反而十分乐观。他认为计算机不会具备生物进化的能力,也不会自己发明东西,因此,将不会对人类具有威胁性。相反,呆板的工作将由机器人承担,人类则去做更有趣的工作。地球的环境也会变得越来越好,人类将会活的更久更快乐,也更有创造性。同时,人们不会出现在战场上,机器人会亲自出征,这些会防止人类因战争而致的伤残。
让机器自我学习
就像每个人在获得技能前,必须经历过学习训练一样,机器要实现智能化,也只能通过学习。机器学习起源于人工智能的一个分支,在这一领域,计算机科学试图创造计算机的类人智慧。
真正的机器学习与我们所认为的传统编程有本质的不同。当提到电脑程序时(或者一个程序里用到的运算法则),我们一般会认为是工程师为电脑下达了一系列指令,告诉他们怎么样去处理一系列的输入,然后产生相应的输出。一个浏览器会跟踪被浏览的网页,然后对于用户的输入通过一种确定的可预料的方法进行回应。但这些都是由人类事先编码好的,而非机器主动学习的结果。
机器学习,就是机器自己编程,这些机器经过培训,也能像人类一样进行编程。谷歌公司2015年发布了一款名为“深梦”的图片识别应用软件,这款软件不仅可以识别图像,而且可以利用图像制造一些出人意料的奇幻景象。例如,你呈现一幅风景图时,软件会根据你的图片进行分析,输出一幅计算机眼中的风景图。
这是怎么做到的呢?谷歌深梦的运作原理是通过模拟人类的神经元网络,建立起计算机自己的神经网络系统,通过神经元获得物体的信息,从而进行分析。计算机的神经元网络系统包含了上千个互动的神经元,以实现数学上的精密运算。
当然,为了让机器能识别物体信息,在过去四年里,研究者们一直用大量图片训练电脑神经网络,例如给“深梦”软件看许多图片,并告诉每张图片中的主体是什么,一旦“深梦”从上百个角度看过上百个狗头一千次之后,它就能学会自己输出图像。
在实验中,“深梦”产生出了混合着鸟、眼睛和狗头轮廓的模糊图像,虽然它们并不那么栩栩如生,但是也揭示了电脑处理图像时的一种创造性,它已经不用人类监督指导地学会了识别小猫、小狗的脸。
神经网络的机器构造模仿了人类大脑,也充分发挥了计算机超强的记忆功能,在生活中有更普遍地应用。谷歌的搜索引擎、亚马逊的推荐目录、脸书的好友动态和垃圾邮件的过滤,还有军事、金融、科研、比人类驾车更靠谱的自动驾驶等重要工作,都是神经网络运作的具体应用。
今天,机器学习已经被成功地应用于更多领域,从检测信用卡交易欺诈的数据挖掘程序,到获取用户阅读兴趣的信息过滤系统,再到能在高速公路上自动行驶的汽车。可以说,我们的智能生活,都是机器学习的结果。
研究机器人学习的算法
机器学习能追溯到上世纪40年代二战结束前后,得益于战时交战双方的科学精英殚精竭虑,计算机理论在那一时期得到突飞猛进的发展。当时,控制论研究者们设想有一个神经元计算机模型,能够大致模拟生物神经元,并且可以用一种简洁和明确的数学形式来表示。
但是,面对一个不确定性和多样性的世界,人工预先制定的数学形式根本就难以应付。或者说,人工编程的世界,与现实的人类世界偏差太远,现实的世界不会那么有秩序和守规则。
例如,计算机预先以数学形式来表达马有四条腿,但这会产生两个问题。首先,电脑怎么样去学会理解这个事实;其次,对于那些因意外而失去了一条腿的马怎么办。这些看似是很愚蠢的问题,却是人工编程时遇到的最大障碍。这就是为什么至今搜索引擎还不能回答问题、仅仅能搜索关键词的原因所在。
但如果机器学习创造了自我编程系统,就可以对于他们自己的错误做出反应,并且不断更新他们的内部状态。人工编程中的漏洞在发布之前需要被检查出来,而机器学习的运算法则能在过程之中不断纠错,比人工智能更加灵活、有智慧。
但怎么能让机器学习呢?这就涉及到算法。可以说,算法是构建互联网的核心,现在许多网络搜索和沟通方式,都是基于设定好的数学公式构建起来的,比如谷歌搜索引擎、苹果语音系统、Facebook。在信息时代,我们的生活实际上是被一些数学公式引导着,在医学方面,已经有了公式能算出糖尿病和疟疾。今天,我们也在让学习公式的机器查看胸透时的X线量。
连接学习、符号推演法、贝叶斯学习、类比学习是4个当代计算机学习范式。其中,连接学习就是模仿人脑神经系统,建立起计算机人工神经网络;符号推演法就是将问题或知识表示成某种逻辑网络,采用符号推演的方法来学习;贝叶斯学习理论就是通过概率规则来实现学习和推理过程;类比学习就是通过对相似事物进行比较来学习。这4种学习范式还是过于复杂了,因此,华盛顿大学教授佩德罗·多明戈斯提供了一个更大胆的假设,即在未来,能将现有的算法公式统一成一个万能算法。
万能算法下的世界
多明戈斯构思了这样一个万能算法,它能将物理学、生物学上已经发现的理论和标准模型或者中心法则统一起来,同时,可以从数据中发现所有的知识,所有的人类现有的知识,也包括所有的未来的知识。例如,万能算法可以从第谷·布拉赫的太空观察中,推出牛顿定律,即使它没有相关的基础知识。
大脑皮层可能就是这样一个万能算法的典型例子。一些神经学家认为在所有领域,大脑皮层只用到了一个相同的公式,就能不断调整皮层下各级脑部及脊髓的机能,使他们能根据环境不断学习调整,听见、看见或者是弄懂周围世界的意思。
在信息时代,万能算法也将发挥类似大脑皮层的作用。它能在数据云的基础上,学习和利用信息,改变现在呆板的计算机被动执行模式,主动改进功能和完善输出,这将给人类信息生活带来革命性的转变。
例如,现在的网络信息量庞杂,打几个关键字,却得到了上百万网页,常常令人无法抉择。但有了万能算法,电脑将变成百科全书,只要问几个问题,就能很迅速地给出准确答案。
同时,今天的推荐系统也将得到彻底更新。现在,每个人会遇到许多的推荐信息。基于每个人留下的碎片化的数据,上百万个推荐系统每天会为你推荐不同的东西:暴风影音从你开始看他们的电影时,就为你推荐电影;亚马逊根据你买了什么和没买什么为你推荐书本;新浪会在你注册时推荐上百个兴趣群。但大多数人可能更需要的是一个更聪明的系统,能根据你上网产生的所有的数据和信息,来进行更具针对性的推荐服务。例如,它能在你生活的每个阶段推荐相应的东西,不仅是书和电影,还有房子、工作等。为了能达成这样的效果,首先就需要来自你日常生活所产生的数据,但另一方面,也需要万能算法,因为面对大量的数据,没有公式也无法处理这些数据。
假如真能成功找到万能算法,人工智能将真正实现。但对于未来这一智能图景,还是不免会让人担忧。比如,机器学习能够处理大多数的工作,世界将会有一个很大的失业群体,他们将怎么生存呢?会成为社会不稳定之源吗?假如人工智能被居心叵测的政治家们利用,世界还会太平吗?
对于这些问题,万能算法的倡导者佩德罗·多明戈斯并不担忧,反而十分乐观。他认为计算机不会具备生物进化的能力,也不会自己发明东西,因此,将不会对人类具有威胁性。相反,呆板的工作将由机器人承担,人类则去做更有趣的工作。地球的环境也会变得越来越好,人类将会活的更久更快乐,也更有创造性。同时,人们不会出现在战场上,机器人会亲自出征,这些会防止人类因战争而致的伤残。