从大数据科学到人工智能的迁移过程

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:x21501027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  我们现在这个时代确实是已经从大数据时代,移到人工智能时代。为什么这样讲呢?实际上这和大数据本身的内涵关联性比较强。我们知道大数据本身的规模越来越大,从原来的EB级正在往ZB级发展,数据本身在不停地增加,我们称为数据泛滥。这个数据泛滥包括很多,比如和零售相關有很多数据,再早一点是科学的数据,不管哪种数据都是和网络关联的,个人自媒体出来以后网络数据又非常多。
  数据是不是越大越好,是不是什么东西都一定要一个数据?回答是No。最近有一个非常好的案例,Alpha Go下围棋,以前是需要使用人类下围棋的数据,同时自己尝试了三千万局的数据,最近的Alpha Zero不需要人类对弈数据了,自己会生产数据。
  现在很多的交易、物流、零售,其实它有很多的条件一直在变,不满足刚才的条件,这时候你需要很多外部的数据。有外部数据就够了?当然不是,外部数据怎么用?它自己不会去产生一个用法,这个用法需要人,需要通过人工智能这些手段去用这些数据。所以人工智能实际上就是从大数据科学到人工智能,非常自然的迁移过程。
  人工智能时代
  最近人工智能非常热。在人工智能路上有很多关键人物不能忘记,图灵不能忘记,计算机领域特别重要的一个奖图灵奖,其他学科有诺贝尔奖,诺贝尔时代没有计算机,后来有了计算机以后,大家就想计算机界也应该设一个和诺贝尔奖相当的奖,这个奖就是图灵奖。
  什么叫人工智能?其实人工智能是人类智能的一个计算机的实现,它永远不可能超过人类智能,只是说在某一个特定的方面它可能胜出,但从智能本身它没办法胜出。我们看看智能的定义,其实智能有很多方面,包括逻辑能力、语言能力、空间能力、感知能力,包括音乐感知的能力,肢体的控制能力。后面这几个是比较难的,包括人的内省、自我反省,包括人际关系的能力,包括自然探索的能力,比如发现一些新的东西,完全没有任何线索,你能想出我要做这个,我把这个问题解决掉。自然探索的能力,包括图像、图形的感知能力。
  1956年有一个里程碑式的会议——达特茅斯会议。当时人工智能这几个元老还很年轻,他们集聚到一起开了两个月的会,讨论怎么样让机器具有人的智能、定出了人工智能的最终目标以及什么叫人工智能。现在看起来1956年定义的人工智能的白皮书,到现在一点都不过时。
  这次会议开了以后,全世界很多学校都开始跨入到人工智能热潮当中,典型的像斯坦福大学、CMU、MIT、哈佛大学都在做相关的这些研究,那个阶段大家采用的技术手段,主要是逻辑主义或者符号主义。
  什么叫逻辑或者符号呢?实际上就是他认为一切的推理,我都可以用逻辑演算的方式来实现,我只要定义了整个逻辑演算的体系,做一个规则,就可以完成任何事,可以进行推理、数学证明,可以创作、奏乐等等。其实我们小学就学过代数运算,逻辑也是一种运算,但它用的不是代数运算,而是布尔运算,和代数运算非常接近。有了这个运算就可以对它进行推理,推理你要使用一个工具,他们使用了演绎推理的工具。
  我们知道到现在为止,最主要的自然科学的定理使用的都是演绎推理的方式来完成的。比如说亚里士多德的三段论体系就是非常典型的演绎推理,欧几里得的几何学也是这样完成的,牛顿力学,麦克斯韦、爱因斯坦全都是用演绎定理推出来的。
  所有演绎推理的基础是满足三段论方程。什么叫三段论,我有一个大前提,这是一个一般的原理,我有一个小前提是我要研究的特殊情况,根据大前提、小前提得到一个结论,这个结论是根据一般情况,对特殊情况做出一个判断,这就完成了演绎推理,这就叫三段演绎推理。
  所有的基础逻辑的方法都是这样做的。为了做这个当时设计了很多的人工智能语言,用这种语言可以写人工智能的方程,机器就可以去证明。
  当然这听起来很好,而且第一次浪潮,大家都认为十年之内人工智能一定可以完成很多事,但一直到1976年前后,大家发现一开始定的那么高调的东西绝大多数都实现不了。所以1976年实际上是人工智能第一次的严冬的到来。
  1976年之后尽管没有经费,但是开始有很多做神经元网络的学者,不停的写东西、发东西,一直到1986年出来一个让人眼睛一亮的东西,这个东西叫BP算法(即误差反传网络)。以往的神经元网络只能做非常小的事,做不了大事。但这个东西出来以后可以做大事了,所以就推动了这个领域发展的速度非常快。但它也只能解决一些问题。一开始人们也是期待要解决很多问题,但遥遥无期,到最后又来了第二次的低谷,包括日本第五代机的失败,当时在斯坦福大学要建一个知识百科全书的项目都失败了,使得第二次人工智能又跌入了低谷。
  第三次是从2006年开始的,现在是人工智能的三位知名学者,一位是在多伦多大学的Geoffrey Hinton,一位是在蒙特利尔大学的Yoshua Bingeo,一位是在纽约大学的Yann LeCun,这一年他们分别发表了三篇文章在讲一件事。文章出来了以后,大家并不知道这个东西要怎么用,被李凯和李飞飞做的ImageNet激活了。
  ImageNet是一个全球的图像识别比赛,在2012年以前都是用常规的方法,2012年开始有一个参赛队用了这个方法,比别的队错误率马上降低了一半。到2013年其它方法全部退出,全都是深度学习,2014年不停地改进。直到2015年,错误率已经降得非常多,深度学习的网络也非常多。到2016年的时候几乎做到不光人没法比,错误率已经低到不需要再做了,所以李飞飞选择2017年宣布这个比赛停止,不再做了,因为其实已经没有太大促进意义了。
  人工智能发展机遇
  我国有一个中国人工智能2.0的发展战略研究,今年发布了一个重大研究计划,这里面主要是做五个关键技术和一批应用。这五个关键技术,包括第一个方面是大数据智能,这和前面讲的大数据关联性非常强。第二个方面是群体智能,依靠群体的力量推进智能的研究。第三个是跨媒体智能,要把声音、图像、文字、自然语言所有这些东西联结在一起来研究智能,这是跨媒体智能未来所希望达到的目标。第四个是人机混合增强智能,人和机器混合起来怎么样让智能更高能力更强。第五个是自主智能系统,其实就是无人机。我们有五个支柱,上面是应用,下面是基础支撑。
  那么这样一个轮廓,在国家战略上来说已经进行了非常圆满的布局,这个是不是够了?其实还不是。如果看整个人工智能学科的轮廓,包括计算机视觉、语言识别、自然语言、人机交互、机器学习等等,这些方面目前大的布局是沉浸到应用这个方面。
  涉及到人的九类智能,我们从逻辑语言文字和图形图像来说现在已经做的相当不错,中间六类还是有相当的距离需要探索。总结一下,历史总是这样螺旋前进的,人工智能的三次浪潮也是从符号主义到连接主义。这个符号主义到现在为止已经有30多年,作为人类智能的一个高等抽象,应该是发挥作用的,所以怎么发挥作用,未来大家可以慢慢观察。
  连接主义,就是神经元网络、深度学习,目前是非常大行其道的,但怎么样解决小数据甚至没有数据的学习?实际还是有相当大的挑战,特别是很多的学习结果是不可解释的,这是最大的挑战。行为主义是注重自适应和进化,这是从人从猴子演化过来的,它可能更接近。它怎么样在学习方面做得更好,还是需要探索的。
  ( 根据高文院士在京东金融全球数据探索者大会上的演讲整理而成,未经本人确认。)
其他文献
随着消费电子市场迎来“智能化”普及的高潮,智能化的概念向各个领域快速渗透。汽车作为家庭消费必需品,电气电子程度和移动互联网接入率不断提高,智能化成为大势所趋。智能化的本质,在于设备系统集成度提高,功能扩展性增强,易用性大大改善,给用户带来卓绝的使用体验。在汽车的智能化方面,大众、宝马、特斯拉等车厂已经在前装集成系统方面展开竞争。  全球汽车电子产业发展格局和特点  全球汽车产业规模不断增长的背景下
在互联网时代,企业的信息化架构正在变化。用友超客认为,互联网时代的企业信息化应包括三个层次:第一层的管理信息系统,第二层的电子商务系统,以及第三层的互联网运营系统。那么,企业互联网运营系统到底是什么呢?  今年年初,用友网络重申了企业互联网战略。企业互联网化势在必行。2015年7月新成立的用友超客是用友网络互联网转型的一个旗舰,对于企业互联网有着更深的理解。  专注互联网运营系统  用友超客副总裁
中国经济发展进入新常态,中国IT市场也开始步入了发展历程中的新常态阶段。传统的单维链条生态体系正在解构,越来越多的IT厂商正在积极构筑更为多元、更为开放的“大生态”,而当前的大生态时代正在激发出一个大市场。  2015年3月17日,“2015中国IT市场年会”在北京香格里拉饭店隆重举行。本届年会主办单位为赛迪顾问股份有限公司,指导单位为中国电子信息产业发展研究院,支持单位为中国信息化推进联盟。  
据外媒报道,近日,本田发布了全新的Clarity插电混动轿车。据悉,该款车将在12月1日跟美国消费者见面,起售价33400美元。插电混动版Clarity使用电动发动机驱动汽车,除了电池组之外,电力的另一个来源则是汽油发动机。  据了解,由于Clarity所用的电池符合联邦税收抵免项目,所以消费者将能享受到7500美元的补贴,而各州也可能会推出不同力度的减免优惠。  插电混动版Clarity搭载的是
如果没有云计算操作系统,那么云数据中心底层物理资源的自由调配就是一句空话;如果没有自主可控的云计算操作系统,那么云安全和信息保护也只能是纸上谈兵。2014年12月,曙光云计算操作系统Cloudview v1.8的发布不仅将云操作系统的开放性、兼容性提升到新的高度,而且在安全性和自主可控方面也融入了更多曙光的核心技术。  从用户中来  曙光云计算操作系统Cloudview从2011年诞生至今,版本已
本报讯 7月12日,国产服務器领导厂商中科曙光推出了搭载英特尔全新可扩展处理器的2路机架、4路机架、高密度及刀片共计20多款服务器新品。  中科曙光I620-G30为曙光公司全自主研发的2U机架式服务器产品。在延续以往灵活、可靠等特点的同时,更强调绿色节能和极致性能的特性。I620-G30采用钛金高效能电源模块,支持功耗封顶、动态相位切换技术。TC4600系列服务器是曙光独立研发设计的产品,完美地
“我相信,互联的数字墨水能够改变我们的生活和工作方式。”这是Wacom公司全球CEO兼总裁山田正彦在近日举办的“Connected Ink”活动上的开场白。“我的动力来源于我希望创造一个充满创意的世界,让人们能够自由探索、表达新点子。”山田正彦表示,“在头脑风暴时,为什么大家仍然习惯使用纸和笔?为什么很多人依然随身携带笔记本?我们的签名依然是最个性化,最公认的签收方式。我们的思维语言不是0、1代码
如今,发展数字经济已经上升为我国的国家战略。以2006年发布的《2006—2020年国家信息化发展战略》为标志,中国的数字信息化建设进入了一个崭新的发展阶段。近些年,中国高度重视数字经济的发展,“互联网 ”行动计划的提出促进了互联网与各行各业的深度融合,网络强国战略、国家大数据战略,以及电子商务等领域的一系列政策和措施都成了促进数字经济快速发展的强大助推器。  毫无疑问,我们已经进入数字经济时代!
中科嘉速智慧博物馆一体化解决方案是中科嘉速在多年博物馆的数字化、信息化建设经验的基础上,利用目前先进的虚拟展示、人工智能、大数据等技术设计实现的一套数字化、智能化解决方案,是博物馆发展的未来之路。通过虚拟展示使博物馆展陈和宣传方面的吸引力大大提高,也提升了观众的互动性和参与性,激发了观众对中华传统文化的学习兴趣。同时,借助于人工智能、大数据等技术使博物馆的管理手段更加科学、更加智慧,引导博物馆形成
谷歌AlphaGo赢了,靠什么?靠计算。当终端计算转向云计算时,人工智能终究也会依靠云计算。而依托云计算的各种云服务所面向的客户也不仅是人类,未来的客户也可能会是人工智能。如何快速搭建优质的PaaS平台将是云服务厂商要解决的问题之一。  近期,最引人关注的IT业界事件之一莫过于谷歌AlphaGo和人类的围棋对战了。想起19年前,深蓝“打败”卡斯帕罗夫,当时人们还在笑谈,那只是运气罢了。而如今,谷歌