人工智能新纪元(下)

来源 :大自然探索 | 被引量 : 0次 | 上传用户:eesilver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  
  人类创造之物是否能让它的造物主都感到吃惊?它是否能做出自己的选择?在神秘的犹太传说中,巫师们将灵符插入土制魔像口中,就能赋予魔像生命。阿西莫夫的科幻小说《我,机器人》被拍摄成电影后,激起了全社会对机器人是否属于生命体的广泛探讨。
  1843年,英国数学家巴贝奇设计了一台“分析引擎”,被后人视为电子计算机的前身。巴贝奇的好友,同样是数学天才的伯爵夫人洛芙莱斯为这台装置编写算法。值得一提的是,她也是全世界第一名程序员。虽然洛芙莱斯认为世间一切存在都能以数学的形式呈现,但对于这台分析引擎,她是这么评价的:“分析引擎的发明,绝非假装去创造什么。”伯爵夫人的言下之意是说,机器虽强大,却只能执行人设定的指令。
犹太教魔像的历史最早可以追溯到16世纪.可见人类对创造智能的渴望由来已久。
洛美莱斯为分析引擎编写了运行程序,她也是所有程序员的鼻祖。

阿尔法狗的创世之举


  仅仅过了173年,在2016年3月,谷歌旗下的“深度思维”公司研发出的人工智能“阿尔法狗”击败了著名围棋选手李世石九段。一年之后,2017年5月,“阿尔法狗”的下一版“阿尔法狗零”又战胜了世界围棋第一人柯洁。这些人工智能的研发者甚至完全不能理解“阿尔法狗零”的围棋战术,但这并不妨碍“阿尔法狗零”战胜人类。2017年lO月,新一版的“阿尔法零”又完胜了它的前辈“阿尔法狗零”。阿尔法零的进步速度超过它的所有前辈。
  阿尔法零在人类世界已经没有对手,于是研发者将方向对准了其他人工智能。阿尔法零大比分战胜了此前被誉为“国际象棋之神”的人工智能“鳕鱼”,成为了国际象棋领域的新王者。在后续挑战中,“阿尔法零”用14小时战胜世界顶级将棋程序“艾莫”。人工智能在棋类领域的飞速攻关,让我们真正体会到了机器智能的指数型增长速度,超强的学习能力和飞快的迭代速度。
  “阿尔法狗”系列人工智能的出现并非例外,而是这个时代人工智能的常态。几十年前,工程师们研发出了能够从过去的经验中总结和学习的智能机器。正是这项关键技术的出现,才发展出了现代人工智能。研发人工智能的关键点,在于让它们自己学会处理问题——这是因为在许多情况下,编程人员不便直接编写程序。这种让机器自学的方法名为“机器学习”。机器学习是人工智能的理论基础。
“阿尔法狗”,击败了当时围棋世界排名第一的柯洁九段。

  如何让机器自己学习?我们小时候学骑车时,自行车并不会自己回到家里;以前使用的机械打字机,也不会提示你单词的正确拼写。在过去,人们眼中的机械行为是笨拙、刻板和按部就班的。在这种背景下,机器学习听起来更像是自相矛盾的蠢话。
  今天的人工智能已经可以汲取经验并改善行为,智能手机输入法的“输入联想”是个很好的例子。当开启这项功能后,你只需要输入一句话的前几个字,输入法便会自动给出一些结尾词组。输入法并不能预测你的想法,也无法执行复杂的语法规则计算,它只是将和前一个字词匹配可能性最高的结果呈现给你。在你进行输入之前,输入法已经收集了海量的文本信息并进行了数据分析。这种搭配方式还会根据你的使用习惯微调,所以你会发现,使用时间越久,手机输入法和自己的匹配程度便越高,因为输入法已经掌握了你的语言习惯。
  在这套算法的基础上,输入法可以应对各种语言,适配海量的用户使用习惯,记录各种奇怪的词语搭配。输入法给出的建议选项的匹配精准度,取决于数据的数量和质量。只要输入法掌握的数据量足够大,并且主题贴合用户正在输入的内容,用户输入的内容越多,输入法的匹配结果就越精准。以经验为基础改善行为,这恰恰就是机器學习的定义。输入法面对的学习资料库包含数以亿计的短语,人类面对如此超容量的样本完全束手无策,而这种数据量对现代计算机硬件来说根本不是问题。
  许多人认为,这样的人工智能根本算不上智能,因为算法本身就不智能。如果你也抱有这种看法,那你应该去了解网络购物网站的“自动推荐功能”的复杂程度,说不定你会更加惊讶。购物网站通过分析用户之前的购买记录,甚至只需要分析用户浏览过哪些商品,就能自动挑选出最匹配的推荐商品,而且很有可能就是你想买的。要达到推荐商品的智能化,人工智能需要分析购物网站数据库中数以百万计的交易记录、搜索记录和商品信息。算法需要提取并学习的类目信息可能是天文数字。购物网站亚马逊拥有2亿多会员,光是图书这一个品类下就有300多万种产品。会员和产品这两类信息的搭配组合是一个人类无法想象的天文数字。
  在人工智能出现之前,如果要实现智能化推荐,计算机工程师必须搭建数学模型,去分析每一个客户的心理趋势,读取每本小说的用户评价,再根据商品的自身属性等信息进行复杂运算。然而在人工智能出现后,设定算法的任务被交给了计算机自己来完成。人工智能从海量数据中总结出的规律,准确率往往超过有丰富经验的人类。从这个角度看,有人质疑人工智能的“智能性”是可以理解的,但是人工智能在经验中改善结果,展现出的学习能力是不容置疑的。

机器翻译


  不同语言之间的相互翻译,是人工智能领域让人印象最深刻的应用之一。谷歌公司的在线翻译服务可以提供135种语言的互相翻译,文种甚至包括南非的祖鲁语。
  工程师不会教翻译软件人类的语法规则,而是让它自己找到规则。2003年时,谷歌公司在翻译服务中采用了“统计机器翻译”技术,让软件在互联网上寻找大量有原文和译文的文本,建立庞大的统计翻译模型,从中找到语言的规则。起初该系统运行速度极慢,翻译1000个句子需要1000台计算机运算40小时。经过了14年不断优化和学习,现在软件已经可以实现实时翻译。
  用户将原文输入翻译界面后。句子被拆分成词组和短语。由于每个字、词、短语甚至句子都对应不止一种译文,软件会将所有的译文都罗列出来。并给出所有译文的正确概率。一句话有多种折分方式,每个短语也会有多种翻译方法。如何从所有这些可能的翻译中挑选正确的译文,并按照目标语言的语法组装成正确的一段话,还要符合原文的真正意思。这才是最困难的地方。
  这个过程计算难度非常大,但是现代计算机的计算速度处理起来并不困难。翻译软件中有两张表。其中一张表记录目标语言的数据,另一张表记录原始语言的所有短语和所有可能的译文。两张表格里记录的都是来源可靠的海量文本语料库。例如有23种语言译文的《欧洲议会章程》,改变其中一些条目。系统运作的方式也会相应变动。在经过大量训练并介入纠错机制后,系统猜测的准确率会大大提高,翻译质量也随之提高。因此,翻译软件并不需要理解语言本身,它只需要理解数据类型,并经过大量训练就能很好地完成工作。
现在软件已经可以实现实时翻译。

模拟人类行为


  前面提到的例子,还只是人工智能最简单的应用领域。利用相同或类似的数据分析技术,计算机可以同时调用不同的硬件资源进行大规模计算,以实现面部识别、语音转录成文字、翻译文本等功能。一些在线婚恋公司通过人工智能,根据用户基本个人信息和偏好,实现了自动推荐婚恋对象的功能。换句话说,计算机已经能够模拟复杂的人类行为。在这方面,人类自己都无法完全模仿。
  人工智能的复杂程度还远不止于此。在线购物网站对用户的数据收集,不仅仅包括购买记录。从打开购物网站的那一刻起,用户的一举一动都被后台的人工智能记录下来:你把什么商品放进购物车,但随后又删除了:你评价了哪些商品:你把哪件商品添加进了“心愿清单”(可以让你的朋友在需要送你礼物时,知道你喜欢什么)等等。每条购物信息中又包含很多子信息:购买日期、收货地址、支付方式,甚至是完成交易的总时间。人工智能通过对用户的每一条历史记录进行分析,就能了解这个用户的年龄、性别、收入情况、购买倾向、家庭成员和财产状况等等隐私信息。对某个区域上百万用户的分析,又能总结出该区域内的用户购买倾向。
  消费者的购物行为是能够被预测的,人工智能要做的就是不断分析庞大的用户数据,从而预测你的购买行为。有些算法可以根据用户使用习惯,实时调整自己的表现:另一些算法则需要断线升级后,重新上线。但所有人工智能都会学习用户行为,以便更好地为用户服务。人工智能对用户的跟踪和对用户偏好的学习是不间断的,我们的决定无时无刻不受到来自人工智能的影响,我们最后买到的商品往往是系统推荐我们购买的商品。
  有时候,系统会给一个从来不钓鱼的女性消费者推荐鱼竿。一般情况下,消费者会以为这肯定是系统出了问题。其实,人工智能恰恰在试探你对这件商品的反应。根据你的反应,零售商可以得到许多有用的信息,来改善自己的营销策略。自动推荐系统一方面要向用户推荐他们最有可能会买的商品,一方面又要用其他商品试探用户的反应。相比单纯的销售商品,购物网站更想知道,你身上还有什么是他们不知道的。人工智能也充满了好奇心,想了解关于你的一切。除了购物网站外,邮件服务商的垃圾邮件过滤功能和其他软件服务商也在时时记录用户的偏好,并预测用户接下来的行为。在不久的未来,家用电器也会开始预测主人们接下来要做什么。
信用卡公司可以根据收集到的用户大数据,了解客户方方面面的隐私。
深度學习能够从数据中提炼高度抽象的关系,模仿人脑的机制来解释数据,可以做出和人类同水平的判断。

  机器学习不仅仅是分析过去的人类行为,而有时还需要预测、解决新情况。比如购物网站遇到了一个新注册的用户,该向他推荐什么商品?一本新书上市,从未有销售记录的情况下,网站应该向谁推荐?解决这个问题的关键是分析相似的客户或商品信息,从中归纳有价值信息。即便是从未使用过该网站的用户,他们的登录邮箱和收货地址都能给购物网站提供判断的依据。这种探测并利用类似信息的能力,被称作“类型识别”。类型识别是智能行为的一个重要组成部分,只有具备了这点,才能被称为智能化。
  如何判断两件商品是类似商品?作为商品,一本书包含了许多信息:总页码数、文种、主题、价格、印刷日期、作者和推荐度。作为消费者,最主要的信息包括年龄、性别和居住地。机器学习会利用这些信息,去寻找一些已经有大量交易信息的同类商品。新产品被推荐给消费者后,消费者的购买率又能改善匹配的精准度。   机器学习的难点在于如何选择关键信息进行匹配。对于书本商品来说,一本书的价格是关键信息,至于书用什么字体印刷就不那么重要。在图片识别领域,挑选关键信息显得非常必要。在许多国家,出入境比对护照的工作都交给了计算机来完成。如果你先拍摄一张护照肖像照,等待一分钟后再拍摄一张,你会发现两张图片的像素点并不完全相同。两者的差异,足以让计算机判定这是两张不同的图像。要让计算机识别人脸的水平达到人类的水平,就不能让它们只判断像素点,必须有一种更稳定的判断标准,计算机才不会被照片上任何小小的差别误导。
你永远猜不到购物网站人工智能的好奇心有多强烈。

  要做到这点谈何容易。人脸时胖时瘦,一年四季肤色不尽相同,更别说拍照时不同的光照、拍摄角度和距离、镜头焦距、背景材料和颜色等等因素都在干扰最后的成像。既然不可能将所有因素一一罗列建模并分析,软件工程师们只能再一次求助于机器学习,他们将希望放在“深度学习”上。简单地说,深度学习能够从数据中提炼高度抽象的关系,模仿人脑的机制来解释数据,可以做出和人类同水平的判断。因此,深度学习不再局限于没有意义的单纯数据,并且能够从数据中认识事物。深度学习在面部识别、语音识别、情感分析、金融分析和图像搜索等领域发挥着重要作用。

机器学习的分层


  人工智能领域中的“深度学习”概念,指的是一种数据导向型算法。深度学习依赖一种叫“神经网络”的技术。面部识别对于计算机来说是一种复杂的运算。凡是涉及人类感知的问题。神经网络技术都能有效解决。
  神经网络技术借鉴了人类大脑皮层,采用了一种松散的生物类比技术识别人类面部。相机感光元件收集到的原始信息穿过神经网络时,在一些简单的神经元被处理,每个简单神经元都负责识别数据的某个指标。一些低层神经元负责探测图片中的简单特征——例如直线,并将信息传送给更高级神经元。不断重复这个过程,神经网络就能够识别图片中非常复杂的结构。
  神经网络可以被训练得更灵活、更准确,这才是最重要的一点。通过训练,神经网络可以明白一张图片中,哪些区域是人的面部,哪些面部特征基本不变。这个学习过程依靠神经网络独立完成,不需要人类干预。
  神经网络技术刚出现时,表现很不理想。但随着硬件水平的突飞猛进和大数据采集。神经网络技术绽放了新生命—一在视觉和语音领域展现了非凡的实力。深度学习技术就被广泛用于体量更庞大的机器学习系统上。

冲经网络如何十八出图片中的狗


  
  训练阶段
  神经网络被输入上万张动物照片,每张照片都标注了该种动物的名称,人类通过大量数据训练神经网络。
  输入阶段
  完成训练的神经网络被输入一张没有标记名称的动物照片。
  第一层
  砷经网络开始对最简单的元素,例如动物的边缘线作出反馈。
  更高层
  神经网络对更复杂的结构做出反馈。
  最顶层
  神经网络能够像人类一样,识别各种动物的显著特征,对高度抽象的动物特征作出反馈。
  输出结果
  根据之前的训练,神经网络猜测出该动物最有可能是狗。

引擎盖下的复杂运作


  请想象现在机器学习是一台汽车发动机,里面充滿了各种零件。这些零件组装在一起,可以同时发挥各种功能:发动汽车、打开收音机和开启车灯等等。但这些功能只是你看到的表面现象。在汽车引擎盖下方,整个系统内部可能正在进行复杂的测试,来检查哪种方法更高效、更安全、更能满足车主的需求。
  这就是著名的“A/B测试”,用户每次使用网络服务,都在向服务商提供大量信息。其实,服务商在提供服务时,并不知道自己的服务能否让用户满意。因此,服务商会选择对不同用户提供不同服务产品,在统计用户反馈的数据后,哪种方法效果更好便一目了然。用户提交数据的方式也很简单:点击某个广告,或是用比平常更短的时间进入了某个商品页面。用户几乎没有意识到自己在帮助服务商改进服务质量。
  这些技术中的每一项单独看来原理都不复杂。在大规模层面上对这些进行长期、自主性利用,便会产生高度适应的行为,在人类看来,仿佛有智能一般。“阿尔法狗”的制胜策略,在于结合了“蒙特卡洛树搜索算法”和深度神经网络算法。击败李世石的上一代“阿尔法狗”用了3000万局棋局作为训练数据。“零”仅仅和自己对弈了490万局,就完成了赛前训练。每当柯洁落子,“零”会和自己先进行上万局的对弈,从中挑选出结果最优的落子位置。每当我们明白人工智能的工作原理,都会有种“对方作弊”的感觉。因为在人类看来,要具备智能,首先要有自我意识。在哲学家们对这个问题争执不休时,人工智能领域的发展依然在不断推进。
  说到这里,就不能不谈人工智能的明天。当前人工智能的发展越来越成熟,也走进了“数据驱动型人工智能”的故有套路。所有的人工智能,都是以数据分析为核心。可以预见,在许多年以后,这种发展模式依然可以获得丰富的成果。在未来,我们能坐进自动驾驶程度更高的汽车;机器翻译的结果会更加通顺和准确:照相机和摄像机会更加便捷易用;手机的功能会更加强大:我们的居住环境也会更加智能化。但人工智能在核心技术层面依然有很大的进步空间。
  从概念被提出到实体应用,人工智能每年都在突破人类最前沿的想象。在为人工智能领域取得飞速发展而欣慰的同时,许多科学家也开始呼吁警惕人工智能对人类生存带来的威胁。著名的“曲别针制造机”思想实验就论述了一个一心制造曲别针,最后不顾一切毁灭了地球的人工智能。人工智能是目前最有发展潜力的领域。目前的数据处理型人工智能是否就是人工智能最终的形态?从科学史观来看,我们还没有遇到人工智能领域最颠覆性变革的到来。
几乎所有手机App都会用到A/B测试。
如果人工智能失控,整个地球的资源都会被用来制造曲别针。
我们接触的人工智能只是它庞大体系中的一部分。

  目前人工智能在图像识别的准确率和辨识速度已经不输人类,在此基础上国内外都在研发无人驾驶汽车,深圳甚至出现了无人驾驶公交车。在医疗领域,国家超级计算长沙中心研发的人工智能只需要0.05秒便能诊断一份病例,和医生做出的诊断结果一致性达到98%。人工智能在金融行业的表现更加亮眼,德国一家世界级资产管理公司采用了人工智能进行股票交易,结果让所有人大吃一惊,收入回报率达到500%。人工智能可以让我们生活的城市更加安全,交通更加高效便捷。大量机构和厂商在基础层、技术层和应用层这三个层面不断取得突破,将驱使人工智能以指数级增长。基础层负责提供人工智能领域所需要的运算、传感器、存储技术、大数据和云计算等基础支持;基础层的研发成果是技术层的根基,在此基础上,算法开发、图像识别、语音处理和智能机器人等技术不断诞生并快速迭代更新:大众接触的人工智能产品和服务则属于应用层,应用层作为最靠近用户的层面,具有最丰富的呈现形式。
  未来人工智能的发展模式是什么?未来的超强人工智能可以实现什么?这些问题,可能连人工智能自己也无法预测。
深圳出現了无人驾驶公交车。
其他文献
莫妮卡·加利亚诺是西澳大学的一名进化生态学家,最近她一直在为自己的实验结果而焦心。加利亚诺的课题组在做一个关于植物联想学习的实验:能否像巴普洛夫训练自己的狗那样训练一株豌豆。两个星期过去了,实验似乎没有什么进展,大家都以为这一实验已宣告失败。  一天,当加利亚诺进入实验室准备拆掉所有的器材时,突然间,她明白过来——那些植物的行为不正如她之前所设想的那样吗!只是那些植物做得太好了,远远超出了研究人员
期刊
南美洲巴塔哥尼亚让人窒息的景色非常适合美洲狮生存。在这广袤的原野上,美洲狮是一个“关键”物种,它的存在支撑着更大的生物多样性。美洲狮已经在这里称霸上万年.除了人类,它就是这里顶级的掠食动物。  马克·厄布罗奇正在地上艰难地爬行,穿过草木丛生的狭窄拥挤的小道,他扭来扭去转向一片开阔地,透过交错重叠的树枝,他再次看到了这只名为“欧普托斯”的美洲狮。弯曲低垂的树枝形成了一个开放式的小密室,它就懒洋洋地躺
期刊
萨默顿谜案是澳大利亚历史上最令人困惑的悬案之一,70年来无人破解。最近,有学者计划通过遗传系谱学技术确定本案死者的身份。2010年初的一个傍晚,澳大利亚布里斯班的小学教
一位毒理学专家,在隔着乳胶手套的情况下接触了两滴二甲基汞液体,接下来她的大脑发生了不可思议的变化。  1997年1月20日,美国一家医院的急诊室接收了48岁的凯伦·维特翰女士。病人被送进医院时已经十分萎靡,听觉和视觉存在不同程度障碍,口齿不清,甚至无法正常步行。她说自己这几个月来出现了恶心、腹泻和腹部疼痛。  凯伦女士就职于“常春藤联盟”之一的达特茅斯学院,是一名研究毒理学的化学教授。在对凯伦进行
期刊
敬畏火山无需恐慌火山活动是一种重要地质现象,火山活动是地球有生命力的象征。火山在给人类和自然界造成灾害的同时,也创造了无数财富。我们应科学客观地对待火山。躁动的超
唯有爱满天下,才能换来桃李芬芳。关爱学生要处理好严与爱的关系,教师要严得有理,爱而不纵。只有将尊重、爱护学生和严格要求学生有机结合起来,才能调动师生双方的积极性,产生最佳的教育效果。  鲁迅先生曾说过:“想有乔木,想看好花,一定要有泥土;没有土,便没有花木,所以土实在较花木还重要。”可见教师在学生成长过程中所起的至关重要的作用。某一调查组从学校随机抽取100名教师问卷:“你热爱你的学生吗?”90%
2010年的信息技术学业水平测试已经圆满结束,如何提高学业水平测试的合格率,搞好信息技术考前复习工作显得很关键。结合教学实践,从认识信息技术学业水平测试、制定执行计划
科学家最近首次证实有太阳系外天体进入太阳系,但这也挑战了现有的行星形成理论。  韦瑞笑称自己是“地球卫士”。每天,这位美国夏威夷大学的博士后都会进入自己位于美国火奴鲁鲁(檀香山市)被棕榈树环抱的办公室,审阅头一天晚上采集的来自外太空、可能威胁地球的天体信息。在地球早期预警系统的数据流中,韦瑞常常是第一个发现新的、具有潜在危险性的“近地天体”的人。“全景巡天望远镜”(或称“快速反应系统”)位于夏威夷
素有文坛鬼才、全才之称徐訏的小说创作中蕴涵着浓厚的距离意识,这是一种专注审美的心理距离,在不同阶段的作品中重心有所不同。早期的创作倾向于营造美的距离,以停顿在美感
几年前,我在书店的展架上看到了《大自然探索》。当第一眼瞥见那崭新迷人的封面,我便被她深深地吸引住了。我拿起她,轻轻地摩挲着鲜艳的封面,想象着里面藏着怎样的精彩。当我
期刊