沃森还会做什么

来源 :第一财经周刊 | 被引量 : 0次 | 上传用户:djs4520345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  超级计算机沃森并不想重复它的前辈深蓝的凄惨晚年,它为自己找好了出路:每年为IBM带去新生意。
  这不是现在它自己就可以作出的决定—注意,我说的是现在。至于以后,这会是一个更重大的话题。
  我们可以先从它怎样为IBM带去新生意谈起。接受《第一财经周刊》采访的沃森商业化主管Manoj Saxena最近透露说,IBM的相关规划已经制订到了2015年。而到了那一年,“包括沃森项目在内的IBM数据分析业务收入将超过160亿美元。”
  这不算一个小数目,它看起来比深蓝要厉害多了。要知道因为击败了国际象棋冠军,深蓝也曾经名噪一时,但它最终只是成为了IBM每年公司折旧费用上的一部分数字。
  很大程度上,这是因为沃森站在了深蓝的肩膀上。
  2011年2月16日晚,在超过3500万名观众面前,沃森在美国著名的智力竞赛节目《危机边缘(Jeopardy)》中,击败曾连续74次夺冠的Ken Jennings和另一位选手Brad Rutter,拿走了100万美元奖金。后来Ken Jennings在他的题板上写下了那句被人们所熟知的话:“嗨,电脑们。现在,我们的新老大来了!”
  他是被这样一台东西击败的:它有一块方型显示屏,还有90台IBM POWER 750处理器—其中包括2880个CPU,还有15TB的内存。这些都被藏在演播室上方的机房里。
  IBM大中华区Power服务器产品部总经理侯淼解释说,这样的配置可以让沃森每秒进行80TB的浮点运算。这相当于每秒阅读100万本书籍,而它身边的Ken和Brad可能一辈子也读不完其中的1%。


  类似这样的超强运算能力深蓝其实也具备,并且也正是依靠这种能力,它才可以每秒分析2亿步棋,最终战胜了卡斯帕罗夫。但如果要让深蓝参加智力竞赛,它可能一题也答不上来,甚至连问题也无法理解。
  这正是沃森的强大之处:它可以理解人们所说的话,并快速做出反馈。这个被称为“头脑”的部分,是IBM为沃森研发的深度问题回答(Deep QA)技术。
  再通俗点说,这是人工智能(AI)的真正开始。
  举个例子的话,当沃森被问到“哪个城市在2008年举办了一项标志为‘五环’的重要赛事”时,它的整个处理过程是这样的:第一步,根据语法,找到“问题焦点”并进行标注,在这一题中,“城市”就是问题焦点;第二步,它会对“2008年”、“标志”、“五环”、“重要赛事”等关键词,按照不同权重进行知识库搜索,从中抽取初始答案;第三步,将这些初始答案—常常是成百上千个模糊答案,重新带回到问题中;最后一步,也是最关键的一步,沃森通过一个学习模型,综合搜索信息,对所有答案按照概率排序,将它认为可能性最大(概率最高)的三个答案显示到答题板上。整个过程都发生在几秒中之间。
  IBM在全球拥有12个研究院,每年会投入60至70亿美元进行研发。“有一类研发公司内部称为Grand challenge。”侯淼说:“一旦研发成功,将会对整个社会产生非常巨大的影响。”
  2000年初,时任IBM总裁的彭明盛第一次对研发部门提出了“Grand challenge”的目标,希望到2011年也就是IBM诞生100年时,能够研发出一款革命性的产品,影响整个计算机行业未来的走向,甚至能够对人类有非常巨大的帮助。
  4年之后的一天,IBM研究经理Charles Lickel在一家餐厅里和同事吃饭,突然之间,整个餐厅安静了。他发现所有人的目光都集中在了大屏幕上,期待Ken Jennings扩大他在《危机边缘》节目中的连胜记录。
  这个情景让Charles Lickel产生了一个想法:让IBM开发一款答题机器。这个想法很快得到了上层的支持。IBM语意分析与综合部接下了这个最具挑战性的项目,从2006年开始进行了一系列测试。
  在最初的测试中,研究人员向沃森提了500个《危机边缘》中出现过的问题,沃森只能答对15%左右的问题,而节目中最好的选手,可以用比沃森少一半的时间答对其中95%以上的问题;从2007年开始,IBM给这一项目加派了15个研究人员,希望通过3至5年的时间把沃森训练成一架优秀的答题机器。
  在此过程中,沃森进行了55次模似竞赛,这些比赛完全按照《危机边缘》的赛制,邀请节目中的冠军们和沃森进行比拼。当沃森答错一题时,沃森会对错误答案进行记忆,当下一次碰到同类型问题时,将对原有的答题逻辑进行优化,避免再犯同样的错误。这跟人类的自我改正十分相似。
  在整个训练过程中,沃森逐渐取得了70%的胜率。到了2011年比赛前的最后几个月,沃森几乎可以击败所有的选手,它准备好了。
  除了强大的计算能力和海量的数据来源,研究人员为沃森设计的自我记忆、纠错、学习的模型,成为沃森不同于其他超级计算机的关键。这样的“学习模型”,也出现在Google无人驾驶汽车的研发中:技术人员每天带着电脑上路,让它记忆人类在驾驶汽车的过程中,面对不同情况时的应对方法。
  不同的学习模型可以造就不同的沃森,这也是IBM在考虑沃森的商业化方向时,需要面对的问题:沃森到底是什么、它应该解决什么问题。
  在IBM的官方网站上,对沃森的介绍是“集高级自然语言处理、信息检索、知识表示、自动推理、机器学习等开放式问答技术的应用”,但这样一个文绉绉的解释,很难说服那些目标客户。这些客户通常只在乎自己的钱花在了哪儿、沃森能为他们做什么。
  IBM资深副总裁和研究主管John Kelly在接受媒体采访时曾表示:“我们真的认为它可以用在任何地方。”同时他和他的同事也清楚地认识到沃森真正的“基因”:它可以在很短的时间内处理海量的信息,并从这些信息中找出有价值的部分,通过自然语言同人类实现信息的交流和交换。   这让沃森可以成为一个“智囊”、“顾问”和“助手”。那些需要处理大量数据、知识不断更新,同时又需要据此做出复杂判断的领域,成为了最能发挥沃森作用的领域。
  沃森在医疗行业找到了自己的第一份工作。根据IBM和医疗保险公司Wellpoint的协议,从2012年年初开始,沃森将帮助护士们管理复杂的病例和来自医疗服务提供商的请求;然后,Wellpoint会开发一套面向医生的技术,使得医生可以通过自己的手机和平板电脑,了解肿瘤患者的身体状况。
  侯淼说,选择医疗领域是因为这里具有良好的档案储存制度,积累了大量的医学数据、病历档案,并进行了科学的分类。这些大量的可搜索数据,是沃森发挥作用的重要前提。
  不同地区医疗水平的巨大差异,也使得沃森拥有广泛的应用前景。“一些偏远地区的小医院也可以通过云端访问全国的医疗数据库,享受到沃森带来的服务。”
  Mark Kris所在的Memorial Sloan-Kettering癌症研究中心(MSKCC)在1年前加入了这一项目。Kris是一位经验丰富的临床肿瘤医师,同时也是《危机边缘》的忠实粉丝。他告诉《第一财经周刊》,从2年前他在电视机前目睹沃森表演的那天起,就对沃森产生了兴趣。
  过去半个世纪,人类在许多领域取得了突破性的进展,但癌症研究和临床治疗方面一直没有重大突破。按照Kris说法,在过去40年中,癌症研究方面最大的突破,仅仅就是让人类了解到了这种疾病的复杂性。
  在癌症治疗领域,不同病人之间有十分微妙的差异,医生们需要有更好的方法了解和区分这些差异,因为这些小差异带来的影响,有时候可能是致命的。
  无法准确知道这些差异的结果,就使医生无法针对每个人不同的病情确定最佳治疗方法。“化疗是常见的一种治疗方法,”Kris解释道,“但是你怎么在数十种不同的化疗选项中进行挑选呢?你又如何确定剂量?怎样的化疗频率才是最佳的呢?”
  在现在这个阶段,沃森还不能马上成为这个救世主。它眼下的主要工作,还是通过搜索医学文献和历史数据,快速为某一患者找到情况相似的其他患者。这一过程可以帮助医生在相似案例间获得更多的有用信息,在信息更充分的条件下做出更有说服力的判断。在沃森之前,医生需要自己熟记每一个病人的情况,还要在新病人出现时立刻从头脑里搜索出相似对象,费时费力,准确性还不高。
  在进入Memorial Sloan-Kettering癌症研究中心之后,“补课”是沃森要做的第一件事,MSKCC的员工和IBM的项目成员一起训练着沃森。从肺癌开始,研究人员通过分享关于肺癌的知识和经验,让沃森了解到所有关于肺癌的内容。
  沃森沿用了它在参加《危机边缘》训练时建立的学习模型:它的所有答案最终都会以一个概率的形式出现,那个概率最高的答案,就是沃森认为的正确答案;当这个答案被证明错误时,沃森会找到它与正确答案之间的区别,以后再遇到同类问题时,就会更新原有的逻辑;另外,它还可以从其他选手回答的同一类型问题中归纳出答案特点,帮助它用来回答这类问题。
  在经过6个月的培训以后,沃森成为了一名可靠的医疗助手。医生们在自己的平板设备中打开沃森的应用,录入数据并提出问题。几秒钟之后,沃森就会提供几个可能的治疗方法,并且以不同的数值表示确信程度。有的治疗方法有90%的确信度,有的则是80%。而选择哪种治疗方式,还需要医生最后拿主意。
  2013年秋天,Kris将和他的同事一起利用沃森帮助真正的病人进行癌症治疗。IBM在前不久联合Wellpoint发布了第一款商业用“基于沃森的认知计算系统”。
  相对于参加《危机边缘》时那个拥有几十排服务器的家伙,从体型上看,这个新系统已经瘦身了不少,仅为一个双门冰箱的大小。
  其中一个很重要的原因是,《危机边缘》中的问题涉及人文、历史、地理、政治等众多方面,选手们碰到相似问题的概率甚至小于3%,所以需要用数量众多的服务器储存足够多的知识。而在具体应用到某一行业时,所需的知识量会小很多,而且遇到相似问题的概率也会提升很多,对服务器的数量要求也就随之降低了。
  沃森原有的Power750处理器也升级到了POWER7+,性能提升了50%。沃森可以用更短的时间处理更多的信息。原来回答问题需要3秒的话,现在就变成了2秒。


  在IBM不断改造和培训沃森、试图提升它的自我学习能力的同时,Google也在人工智能领域取得了突破—它们让计算机认识了“猫”。
  2012年6月,Google X实验室用一个由1.6万多个处理器、10亿个内部节点组成的“虚拟大脑”,模拟人脑中“神经元”的概念,形成了一个“神经网络”。这个神经网络会不断接收新数据。在一些模型的帮助下,神经元与神经元之间传递的数据发生了变化,它具备了初步的学习能力。
  10天之后,这个“虚拟大脑”分析了1000万帧从YouTube上随机抓取的无标签视频剪辑图片,并成功学习到了“猫”的概念,并从随后导入的2万张图片中准确找出了有猫的照片。
  这些试图改变世界的工程师们的下一步,是使这些“学习模型”更聪明、更高效。
  IBM正在琢磨怎样把沃森部署到各行各业。就在这会儿,一台沃森正在接受花旗银行的岗前培训,通过读年报、财经新闻、招股说明书、监视交易,以及学习更专业的金融术语,更好地给客户推荐投资组合,或者回答诸如“接下去的3个月内哪家公司最有可能发生合并?”这样的问题。
  在这个过程中,沃森最大的问题在于学习的速度:如何在最短的时间内学习这个行业的知识、术语,并学会用这些知识进行“思考”。即便学习模型的架构被总体沿用下来,也会根据不同行业做出有针对性的调整。
  沃森还需要变得更聪明。很多时候,病人并不能很准确地,甚至会错误地描述问题。“一个病人说他头疼,但他的问题可能在其他地方。”侯淼说:“这个时候,沃森就需要能够识别出这些问题。”这也是将沃森运用到其他行业要面对的问题—那些“错误的描述”、“善意的欺骗”都需要它去识别和破解。
  信息处理技术的飞跃,已经让人类可以逐步摆脱“样本”的束缚,在最大范围内利用数据,并使计算机具备学习的能力。人工智能的下一个瓶颈,会出现在“认知”部分:即使在智力竞赛中击败了人类最优秀的选手、成为了出色的医生或是最可信赖的投资分析师,也还摆脱不了“运算机器”的身份。学习只是对逻辑和算法的不断优化,但机器本身并没有出现自我意识。
  这是一个更长远和重大的话题,它还需要沃森们首先思考更迫切的一步:怎样改变那些需要依靠海量数据做出重复决策的行业的决策方式,将人类的创造力进一步解放出来。

其他文献
企业可持续发展经济包括了三个部分:资本、人力和自然资源,但是它总被误解为企业社会责任。对此,埃森哲可持续性服务亚太区董事总经理Peter Lacy对《第一财经周刊》记者李蓉慧解释了企业可持续发展的概念。  C=CBNweekly  L=Peter Lacy  C: 企业可持续发展的含义和要把握的核心是什么?它和企业社会责任的区别在哪里?  L: 企业公民社会责任是企业自愿做出的决定和企业开展的志愿
期刊
尽管对于不同的医药公司,OTC(非处方药)在产品策略中占有不同的比重,但不论是从抗风险、摊薄成本,还是品牌声誉的角度来说,都是有意义的。近日,默沙东健康消费品部总经理江华与《第一财经周刊》记者李依蓉分享了其对OTC产品的看法。  C=CBNweekly  J=江华  C: 从产品策略的角度,OTC产品对于医药公司来说意味着什么?  J: OTC在各个公司的定位不一样,但无论是国际上的大型制药企业,
期刊
沃伦·巴菲特大多数时候都把创新的机会留给了别人。不过3月中旬在哈佛大学举行的PYMNTS. com创新论坛上,巴菲特却大谈创新之道。他表示,企业必须随时准备在任何时候都让他们的客户满意。  “我知道杰夫·贝索斯,他永远不停止。零售每一个环节、支付甚至包括IT,与他的云业务一起,都被他看做是可以涉猎的目标。所以,如果你在与任何一个他正好在考虑去做的领域竞争,你最好也好好把它规划一下。已故的苹果CEO
期刊
富士康的业绩又“发作”了。  2012年,这家鸿海集团旗下的著名代工企业创下了上市7年来的最大亏损记录,在净利润上整整报亏了3.16亿美元,全年营收也同比下降了17.5%,为52.39亿美元。  富士康国际在年报中承认,2012年是“极度艰巨”的一年。作为最重要客户的手机行业,淘汰、整合的风暴在2012年几乎达到了一个顶点,触发了整个手机生态体系的重大变动。  富士康国际的困境,与鸿海集团旗下的其
期刊
曾经很让人羡慕的汇丰人寿的豪华直销团队解散了。  3月21日早晨8点半,20多名汇丰人寿个人营销渠道的业务经理被召集到位于国金的汇丰集团总部,汇丰人寿CEO林丽霞宣布个人营销渠道正式关闭,员工还没来得及提问,她就匆匆离开了。  在个人营销渠道的建立上,汇丰人寿一开始就投入了大量资源。它招募的业务员大多是名校毕业或者有海外留学背景的人才。在员工培训方面,它还推出了“中国先锋计划”,为营销员提供LIM
期刊
工资不高,但福利好啊!  没啥福利,但工资高啊!  以上可能是很多公司人选择雇主的一个重要考量标准—待遇怎么样。这的确很关键。智联招聘在2013年农历新年前发布了一个2012年度中国最佳雇主榜单,认真研究一下上榜公司,你会发现它们当然各有各的好,但共通的一点是,它们都给了员工不错的待遇。  《第一财经周刊》采访了这个榜单里的8家公司:腾讯、上海大众、宜家、SAP、徐工、博世、GE和DHLSinot
期刊
老干妈登上了Gilt—一家奢侈品电商网站,并被推举为全球最顶级的热酱。20刀两瓶被老美抢购一空。网编的点评是:“有成熟凤梨和腌渍鱼干的芳香,豆子酥脆而浑厚,余味是种干净的温暖,与猪肉或白饭搭配尤其惊艳~作为最早的辣酱法定产区之一,老干妈最好的年份,大抵还是2006年吧,那年的雨水尤其好,酱体丰富,full bodied vintage!”  这则消息令很多人虎躯一震。有一种“我曾那么接近幸福”的张
期刊
2012年10月,American Apparel在北京侨福芳草地购物中心开了它在亚洲最大的旗舰店。自从2008年正式进入中国市场以来,这个品牌始终有点默默无闻。大多数人路过它们的门店,第一眼都会以为它只是又一家类似Gap的快时尚品牌。但如果仔细看店里陈列的产品,就会发现它有点不一样。  American Apparel贩售的是修身剪裁的基本款,这些T恤、卫衣和鞋包等都带着复古风格。在这里一件T恤
期刊
Q&A:  请问你觉得工作之余还能不能做兼职?现在我们很多同事为了养家,都倾向于想找到一份兼职,有的接一些零活,有的“兼职”的项目,会很大,你怎么看?  这应视每个公司的规章而定。我着眼的不是兼职问题,而是每一个人对自己、对别人、对公司、对工作的敬业态度。  曾子曰:“吾日三省吾身:为人谋而不忠乎?与朋友交而不信乎?传不习乎?”这是《论语》中的经典名句。上班就是为别人做事,是否尽心尽力(尽忠)端看
期刊
在拥有超过77.5万个应用程序的苹果App Store中,每天都有无数Losers。这些Losers很有可能是因为那个“丑陋不堪”的图标。根据移动分析市场调研公司Surikate的统计,81%的英国用户几乎不会去浏览排行榜前50名以外的应用,64%的新应用根本上不了榜单。  所有应用程序开发商都在绞尽脑汁吸引用户那点少得可怜的注意力。强调图标作用的是Louie Mantia。“一款App想要获得成
期刊