论文部分内容阅读
科学家能设计一个在与外界接触和交流的过程成长起来的机器人吗?结合了心理学理念设计出来的机器人将如何以人类婴儿的方式开始了解世界呢?
在20世纪90年代构思开发了一系列机器人的计算机科学家罗德尼·布鲁克斯提出,真正拥有类似人类智能的机器人,需要2岁孩子的物体识别能力,4岁孩子的语言能力,以及6至8岁孩子的社交理解能力。
就目前情况看,机器人还远远达不到布鲁克斯的目标。事实上,如今困扰机器人程序员的一些难题,人类婴儿在过第一个生日之前就解决了,如像伸手拿东西、认人、分辨毛绒动物和其他东西的区别。人类婴儿能很快学会很多东西,并不需要预先的程序设计,婴儿的学习能力是在与周围的人及环境的互动中自然形成的。那么,机器人也可以像人类孩子一样学习,像人类婴儿一样成长吗?
机器人“爱因斯坦”
这是一个名叫“爱因斯坦”的机器人。它有一双迷人的眼睛,有用真正的毛发做的睫毛和乱蓬蓬的灰色眉毛,仔细观察还可以看见它眼睑下面涂的黑色眼线。它看上去神采奕奕,给人很深的印象。
机器人“爱因斯坦”是研究人员协同努力创造的一件了不起的杰作。汉森机器人公司的机器人设计师戴维·汉森以精湛的雕刻技术创造了表情生动的机器人头部,莫韦兰则开发了类似人类感官的机器人传感技术。
只要打开“爱因斯坦”的开关,它就会运行几十种不同的脸部表情:它的嘴唇会做出撇嘴的动作,它的眉头会紧锁;它会把眼睛睁得大大的,仿佛处于惊恐之中,然后眯起眼睛,咧嘴而笑。在它的嘴大张时,可以看到大脑所在的地方是一大团纠结在一起的电线。
这款机器人的表情如此逼真,站在它身旁的人会不由得想用手去触摸一下它那满是皱纹的脸颊。机器人的头部是用一种富有弹性的特制固体胶制成的,这种仿生皮肤材料足以乱真,让机器人的脸看起来就像真人的一样。
除了能做出各种面部表情,“爱因斯坦”还能通过安装在眼睛瞳孔里的摄像装置跟踪人的动作,判断人的性别、年龄(比如40岁以上还是40岁以下),是否戴眼镜、是否在微笑等。“爱因斯坦”还配备了对话软件,能够与人对话。下面是戴维·汉森与“爱因斯坦”的一段对话。
戴维·汉森:你会讲笑话吗?
“爱因斯坦”:小鸡为什么穿越马路?
戴维·汉森:讲讲有关人工智能的事情吧。
“爱因斯坦”:我觉得像真正的智能一样,不像人工的。
戴维·汉森:我想听听更多关于机器人未来的发展前景。
“爱因斯坦”:机器人将变得越来越像动物和人,机器人将给人们带来更多的惊讶,变得越来越“酷”。
目前,“爱因斯坦”作为一个研究工具,科学家利用它来探讨机器人如何感知人类的面部表情并做出相关反应。机器人的这种能力今后在娱乐和教育领域将得到广泛应用,例如未来的机器人辅导老师会及时发现心不在焉的人类学生,提醒他们别再做白日梦。
“爱因斯坦”是一件了不起的杰作。然而,“爱因斯坦”所展示的感知能力和会话能力是设计者预先编制好程序的,它热切的眼神及伶俐的会话能力所显示出来的智慧都只是虚假的表象,它能回答的问题都是预先编好程序的,它解答问题的能力也是极为有限的。总之,机器人“爱因斯坦”并不真是爱因斯坦。事实上,尽管机器人可以做许多令人惊叹的事情,比如拉小提琴、拆除炸弹、发射导弹、诊断疾病、照管番茄的生长情况以及跳舞等,但它们缺少做所有这些事情的自主性基础,它们的能力都是人类事先编制好程序的。它们能够复述笑话,但不懂笑话究竟有什么好笑;它们不能将一部电影的内容用几句话概括出来;如果没有人类给它们编制好程序,它们甚至连给自己系鞋带这么简单的事情也做不了。
而现在,美国加州大学圣迭戈分校机器感知实验室的软件设计师、心理学家哈维尔·莫韦兰领导的一个由认知科学家、工程师、发展心理学家和机器人专家组成的研究团队,希望通过破解人类智慧的奥秘,研发出能像人类孩子一样具有学习能力,能通过与外界的交流逐渐学习并掌握各种技能的机器人。
莫韦兰的机器人之梦
莫韦兰是一个西班牙果农的儿子,在有许多动物的环境中长大,他一直都想知道动物是如何想事情的。他爱问妈妈诸如此类的问题:“小狗有思想感情吗?老鼠有没有呢?”他小时候喜欢做一些自己感兴趣的“实验”,还因做“实验”损坏厨房里的东西遭到祖母的斥骂。在被20世纪60年代的电视节目《迷失太空》中的机器人迷住后,他用食品罐头、灯泡和磁带录音机制作了他的第一个“会说话的机器人”。这个机器人有一个钱币投放口,要求一次投放100美元。如果有人想用较少的钱蒙混过去,机器人就会用预先录制好的声音抗议道:“这不是100美元!”那时,他只有10岁。
1989年,莫韦兰在取得发展心理学博士学位后,在加州大学伯克利分校从事人工智能研究工作。他回忆说:“当时许多人都热衷于研究能登陆火星的机器人,几乎没人对社会型机器人的研究感兴趣,但我的兴趣不在那里,我觉得机器人技术和心理学研究之间应该有更多的交集。”1992年,他来到加州大学圣迭戈分校,开始了如何将人类的各种感知能力“复制”到机器人身上的研究。
2002年,他在日本京都的一个机器人实验室里工作,主要任务是为一个名叫“Robovie”的长臂社会型机器人编写程序。他回忆说,那时他觉得社会型机器人有些恼人,总是说“我很孤独,请拥抱我”之类的话,但日本科学家告诉他,Robovie是一款很特别的机器人。Robovie不停地跟他说话,还不时地抬头看看他。突然,Robovie双臂环绕,给了他一个拥抱。“太神奇了!”莫韦兰说,“这出乎我的意料之外,机器人强烈的感情表达让我猝不及防。”在那一刻,莫韦兰感觉这个机器人活了!
莫韦兰将Robovie机器人带进了他两岁儿子所在的学前班,想了解孩子们对机器人的奇特反应。他没想到的是,机器人的出现吓坏了孩子们。“那真是一场灾难。是我一生中最糟糕的日子之一。”莫韦兰回忆说。孩子们被相当于12岁孩子大小的机器人吓得尖叫乱跑。那天晚上他的儿子做噩梦了, 莫韦兰听到他喃喃呓语道:“可怕,太可怕了!”
回到美国后,在征求了儿子的意见后,莫韦兰重新组装了一个儿童友好型机器人,取名“鲁比”,它也是今天矗立在实验室里微笑着的小机器人的早期版本。“鲁比”身着橙色衣服,脚穿运动鞋,它的脑袋好奇地转来转去,金属身体内部填满了电机和电线。莫韦兰说:“我们从这个机器人小宝宝身上学到了很多东西。”
在过去几年中,莫韦兰给在学前班与孩子们在一起的各种“鲁比”机器人植入了研究幼儿如何回应外部世界的学习程序。有多种“鲁比”机器人,并承担着不同的任务,有的是自主机器人,有的是需要人类操纵的机器人,有的教授孩子们词汇,有的陪伴孩子们散步。虽然“鲁比”机器人需要几个大轮子,还需要大功率的马达,重达135千克,让孩子们望而生畏,但还是取得了一定的成效:孩子们在“鲁比”肚子上的屏幕上玩单词游戏,这增加了他们的词汇能力。不过,“鲁比”的人脸检测器总是将研究坦克引擎的托马斯与另一个人搞混。机器人如何在社会化环境中实现与周围人的互动,这是一个复杂的问题。而莫韦兰的宏伟目标是:创造一个能像人类婴儿一样学习的“机器人宝宝”。
像婴儿一样成长的机器人
在“爱因斯坦”的微笑检测系统里存储了几万个“微笑”或“不笑”的图像,通过将这些图像和现实中的人脸进行对照辨识,“爱因斯坦”就可以“看”到一个人是否面带微笑以及微笑的程度,然后它的语音软件就会说诸如“你的微笑很迷人”、“你为什么一脸愁容”之类的话。这种通过对大量数据进行分析,然后做出判断的学习方式被称为“监督学习”,是机器人学习中的一个很重要的方面。
然而,人类婴儿的学习方式是完全不同的。没有人会指给一个婴儿看上成千上万张脸,然后对他说“这是快乐的脸”、“这是不开心的脸”、“这是左眼”、“这是右眼”… …婴儿轻而易举地就能学会认人,特别是认妈妈的脸,一点都不会搞错,这被称作“无监督学习”。
莫韦兰的博士研究生尼古拉斯·布特科带领他的团队开发了一款“无监督学习”机器人——“贝维”。“贝维”是英文“Baby’s Eye View”的首字母缩写,意思是“宝宝看世界”。 这个看上去像洋娃娃的小机器人能够判断有没有人进入房间。它是怎么做到的呢?在“听”到有人进来的声音后,它就发出婴儿般的哭声。之后,无论是否有人发出回应声音,它都拍一张照片(在它的额头中间有一个仿佛第三只眼睛的摄像头),并对这些照片进行处理,判断其中是否出现了之前没有过的物体(人脸或人的身体)。只需6分钟,“贝维”就能判断是否有人进入了房间。
“无监督学习”方式也是“机器人一号计划”的核心研究任务之一,该计划由莫韦兰领导,旨在研发出比“贝维”更高级的机器人宝宝——它们可以通过摄像机和遍布全身的各种传感器接受外部世界的各种信息,对外部的“有趣”刺激产生好奇心,然后借鉴人类婴儿复杂的行为策略决定采取什么样的行动。研究人员对婴儿和母亲玩“躲猫猫”等游戏的动作和反应进行拍摄和研究,尽可能多地将人类婴儿的行为方式应用于机器人的“无监督学习”过程中。人类婴儿通过无数脑细胞或神经元的连接来完成这一任务,机器人则利用各种软件来模仿人类大脑的神经网络。因此,“机器人一号计划”任重道远。科学家认为,机器人最终能够拥有自主学习新东西的能力。
“无监督学习”型机器人宝宝将拥有碰触、抓取和摇动物体的能力,能“发现”人类婴儿可能遇到的多达100个不同的物体或对象,从玩具到保姆的手,并弄清楚该如何对待这些物体。外部世界的许多微妙之处,都需要它去探索、去发现。例如,一个红色的拨浪鼓和一个红色的瓶子是完全不同的两种东西,而一个红色的拨浪鼓和一个蓝色的拨浪鼓则是同一种东西。
研究人员希望机器人宝宝能像人类婴儿一样,先学会爬,然后学会行走。不过,他们最为宏伟的目标是让机器人宝宝发展出与保姆沟通的能力,例如发出信号,让保姆替它拿它自己拿不到的东西。前苏联发展心理学家维果茨基认为,运动能力是婴儿智力发展的一个重要突破点,通常在孩子大约1岁时,将经历从简单的感觉运动智力向知识符号智力过渡的阶段。如果科学家能够成功,这将是机器人做出的象征自主能力的第一个姿态,也将是人与机器人角色逆转的一个信号:机器人指挥人类(比如机器人婴儿指挥保姆),而不是人类指挥机器人。
这将是一个非常重要的过渡。科学家指出,让机器人拿取某样物体可能很困难,但机器人如果能够明白它想要什么东西,并知道借助于某个对象比如保姆,作为它拿取某样东西的工具,这将是机器人成长迈出的重要一步,因为这是一个极为复杂的心理过程。
“机器人一号计划”中的机器人宝宝的身体雏形是机器人CB2。CB2是“仿生身体的儿童机器人”的简称,这款机器人是由日本大阪实验室研发的。CB2机器人是工程学上的杰作,它拥有一双可以灵动地来回移动的黑眼睛,拥有浅灰色的硅胶皮肤,皮肤表面上有许多用来收集数据的传感器,肢体是用金属骨架和活塞驱动的肌肉构成的,像人类手脚一样灵活,而且动作配合得极好,如果手臂有动作,身体躯干和其他部分就会做出相应的回应。在2007年首次亮相时,它做出了很多与婴儿相似的动作,比如躺在地板上来回扑腾,给人的感觉是:它就像一个真正的小男孩挣扎着想爬起来。
莫韦兰选择CB2作为“机器人一号计划”中机器人身体的原型,并对其进行了一些调整,让它拥有自行行走的强大力量。莫韦兰打算去除有可能影响数据准确性的皮肤层,采用包裹在透明塑料里的金属骨架。他说:“可以让它一直穿上衣服嘛。”他还希望能将机器人做得很小,可以放在摇篮里,但设计师告诉他目前还做不到,机器人宝宝将高达0.9米,重达68千克。
机器人的脸该设计成什么样子呢?像男孩还是像女孩呢?莫韦兰之前设计的机器人宝宝都是女孩,这是他女儿的意见,而现在是要一个男孩的时候了。于是,他和他的同事汉森设计了机器人的脸部,并将它命名为“迪格”。这款“发展型类人机器人”以一个真正的孩子——莫韦兰实验室一个研究员的小侄子胖乎乎的脸蛋为原型。
机器人研究的前景展望
莫韦兰认为,虽然人类婴儿在出生之初几乎什么都不懂,但却有本能的需要,比如肚子饿了,冷了,尿布湿了要换了,都会用哭声来表达自己的要求。可这些简单的问题对于编程机器人来说却相当复杂,就如加州大学伯克利分校一位退休的心理学教授所说:“我们设计的机器人也需要排泄吗?需要按时睡眠吗?”
还有,在成长过程中,人类婴儿的认知能力是随着身体的渐渐长大一起发展起来的。那么,为了模仿人类婴儿的成长,机器人是否也将不断地改变它们的身体形态?又或者,有社会能力的机器人的模样不一定非得与人类惟妙惟肖,就像掌握了空气动力学原理后,飞机像真正的鸟一样飞上了天,但飞机的样子并不像麻雀。不过,莫韦兰认为,让机器人宝宝拥有让人喜爱的外表是很重要的,因为要让它像一个真正的孩子那样成长,就必须将它当成一个真正的孩子来对待。
莫韦兰说,当我们对人类大脑发展有了更多更深的认识,当我们一步步破解婴儿大脑解决问题的奥秘,像人类婴儿一样学习成长的机器人就会出现在我们面前。
社会型机器人
“机器人”一词于1921年开始登上世界舞台,在捷克科幻作家卡雷尔·恰佩克笔下的“人造人工厂”里,机器人首次出现。长期以来,人们对机器人的理解是:通过编程的机器,可以与周围环境互动,多数为人类从事危险的工作或繁重的体力劳动。今天世界上估计有650万个机器人或在工厂里做着平凡的工作,或在人们家里帮助做一些家务,其中有的机器人甚至能担当调制鸡尾酒之类的专门工作。
随着生活水平提高,人口出生率降低,人均寿命延长,社会和家庭生活对机器人的需求越来越大,对机器人的要求也越来越高。科学家现在正致力于将机器人与人工智能结合在一起,以开发出在社交、会话及其他能力方面和人类更像的机器人。这样的机器人被称为“社会型机器人”,它们与人类及其他机器人合作,在医疗保健、执法、婴儿看护和娱乐等领域发挥作用。我们甚至可以期望电影《摩登家庭》中的绕舌的机器人管家罗西真的出现在我们的生活中。你可以想象一下:你喝醉了酒,向酒吧里的机器人侍者倾诉自己不幸的离婚遭遇,后者扬起眉毛,同情地看着你……
机器人如何解读人类情绪
2009年2月1日,100万美国人的头脑里只有一件事——美国超级杯橄榄球大赛,由美国联合会(AFC)冠军匹兹堡钢人队对阵国家联合会(NFC)冠军亚利桑那红雀队。在纽约的一家酒店房间里,46位狂热的球迷正聚集在一起观看比赛,他们大嚼汉堡,猛灌啤酒,情绪高涨。这些体育球迷的行为本身并没有什么好奇怪的,所不同的是,他们的一举一动,甚至他们的每一次呼吸,都在各种机器的监视之下。
这是研究人员正在进行的一项实验,这些正在观看球赛的球迷们身穿配备了各种传感器的背心,实时监测着他们的心率、运动,呼吸和出汗等情况。
探查人类情绪变化是近年来传感技术的最新发展之一。多年来,一些呼叫中心的计算机对人们的声音进行监控分析,以便管理人员了解人们为什么愤怒,以及找到如何让他们平静下来顺利交流的途径;汽车内置报警器能够及时发现昏昏欲睡的司机,并提醒其保持清醒;通过卫星导航系统感受到经历堵车之人的无奈,为司机提供走出困境的替代路线;通过身体语言诊断抑郁症的医疗监测仪器也正在开发之中。机器人解读人类情绪变化的新时代正在向我们走来。
除了科幻小说中的描述之外,早在20世纪90年代中期,美国麻省理工学院的计算机科学家罗莎琳德·皮卡德就开始了机器读取人类情绪的研究,当时她的想法受到了人们的质疑,但她仍然坚持自己的想法,并于1997年出版了《情感计算》一书。她认为,如果计算机系统能感知用户的感受,就能取得更好的人机互动效果。例如电脑辅导老师如果能感知到学生情绪不高,就可像人类老师一样,或者放慢进度,或者提出有益的建议。又如可穿戴式“心情探测器”可以非常直接的方式感知人们的情绪,比如通过测量心跳、呼吸率以及皮肤电导率等变化,发现情绪波动的信号。
通过人们说话的声调来分析一个人的情绪是这类技术中最为成熟的。多年来,一些公司使用“语音分析”软件,自动监控呼叫中心代理和客户之间的对话。除了声音语调之外,研究人员还在研究如何通过对人们的姿势和面部表情的分析,来解读人们的情绪情感。
在这一领域,有许多研究小组都取得了令人瞩目的进展。他们首先“训练”计算机学会识别人的脸部特征和表情。通过一系列算法,确认脸部的眼睛、眉毛、鼻孔和嘴部的位置和特征,将这些特征保存在计算机里,计算机根据代表人类各种情绪的几十种“面部运动模式”实时解读人类情绪。例如,嘴向两边水平延伸,嘴角上扬,代表微笑,再加上眼睛区域的运动,如面颊微耸,鱼尾纹加深,表明是发自内心的笑,而非因出自礼貌而勉强表现出来的僵硬的笑。
使用这类技术,现在的计算机程序已经可以正确识别六种基本情绪:厌恶、快乐、悲伤、愤怒、恐惧和惊讶。在面部表情比较夸张的情况下,准确率可达90%以上。计算机程序甚至还可以准确判断更加微妙的情绪。在实际应用中,为了准确解读复杂的人类情感,计算机还需要参考其他一些线索,如上半身的姿态和头部运动等。而如何找到可以实时地将身体姿势和面部表情融合在一起的办法,以准确读取人的情绪,是一个极大的挑战。
研究人员正在研究如何让计算机更准确地识别人的情绪。大多数人都知道,一个装出来的笑容比真正的笑容更显夸张,而且笑容出现与笑容消失之间的转换也非常突兀。目前先进的面部表情跟踪识别技术,可以将假装出来的笑同看喜剧影片引起的发自内心的笑进行比较,从而辨别假笑和真笑之间的一些细微差别。
还有一些研究团队正致力于研究计算机检测人类情绪的另一个方面——疼痛,并取得了很大的进展,计算机区别真实的疼痛与假装的疼痛方面的能力令人惊讶。美国加州大学的一个研究团队应用面部表情识别软件区分真正的痛苦(双手放在冰水中)和假装出来的痛苦,结果计算机判断的准确率达到88%。而对170名志愿者在同样情况下进行测试,他们判断的准确率只有49%。显然,在判读人类痛苦情绪方面,人脑比电脑差远了。
研究人员还想知道计算机能否从面部表情和身体姿势辨别出人的疼痛迹象,他们希望计算机能够区分真正的生理痛苦表情和非生理原因痛苦表情,由此以更可靠的方式来评估止痛药的有效性。研究人员还开发出了针对弱势群体的情感解读技术,一种被称为“社交情感互动”的计算机软件,可帮助自闭症等感官处理障碍儿童了解其他人的情绪变化,以帮助他们更好地进行社会交流。
在20世纪90年代构思开发了一系列机器人的计算机科学家罗德尼·布鲁克斯提出,真正拥有类似人类智能的机器人,需要2岁孩子的物体识别能力,4岁孩子的语言能力,以及6至8岁孩子的社交理解能力。
就目前情况看,机器人还远远达不到布鲁克斯的目标。事实上,如今困扰机器人程序员的一些难题,人类婴儿在过第一个生日之前就解决了,如像伸手拿东西、认人、分辨毛绒动物和其他东西的区别。人类婴儿能很快学会很多东西,并不需要预先的程序设计,婴儿的学习能力是在与周围的人及环境的互动中自然形成的。那么,机器人也可以像人类孩子一样学习,像人类婴儿一样成长吗?
机器人“爱因斯坦”
这是一个名叫“爱因斯坦”的机器人。它有一双迷人的眼睛,有用真正的毛发做的睫毛和乱蓬蓬的灰色眉毛,仔细观察还可以看见它眼睑下面涂的黑色眼线。它看上去神采奕奕,给人很深的印象。
机器人“爱因斯坦”是研究人员协同努力创造的一件了不起的杰作。汉森机器人公司的机器人设计师戴维·汉森以精湛的雕刻技术创造了表情生动的机器人头部,莫韦兰则开发了类似人类感官的机器人传感技术。
只要打开“爱因斯坦”的开关,它就会运行几十种不同的脸部表情:它的嘴唇会做出撇嘴的动作,它的眉头会紧锁;它会把眼睛睁得大大的,仿佛处于惊恐之中,然后眯起眼睛,咧嘴而笑。在它的嘴大张时,可以看到大脑所在的地方是一大团纠结在一起的电线。
这款机器人的表情如此逼真,站在它身旁的人会不由得想用手去触摸一下它那满是皱纹的脸颊。机器人的头部是用一种富有弹性的特制固体胶制成的,这种仿生皮肤材料足以乱真,让机器人的脸看起来就像真人的一样。
除了能做出各种面部表情,“爱因斯坦”还能通过安装在眼睛瞳孔里的摄像装置跟踪人的动作,判断人的性别、年龄(比如40岁以上还是40岁以下),是否戴眼镜、是否在微笑等。“爱因斯坦”还配备了对话软件,能够与人对话。下面是戴维·汉森与“爱因斯坦”的一段对话。
戴维·汉森:你会讲笑话吗?
“爱因斯坦”:小鸡为什么穿越马路?
戴维·汉森:讲讲有关人工智能的事情吧。
“爱因斯坦”:我觉得像真正的智能一样,不像人工的。
戴维·汉森:我想听听更多关于机器人未来的发展前景。
“爱因斯坦”:机器人将变得越来越像动物和人,机器人将给人们带来更多的惊讶,变得越来越“酷”。
目前,“爱因斯坦”作为一个研究工具,科学家利用它来探讨机器人如何感知人类的面部表情并做出相关反应。机器人的这种能力今后在娱乐和教育领域将得到广泛应用,例如未来的机器人辅导老师会及时发现心不在焉的人类学生,提醒他们别再做白日梦。
“爱因斯坦”是一件了不起的杰作。然而,“爱因斯坦”所展示的感知能力和会话能力是设计者预先编制好程序的,它热切的眼神及伶俐的会话能力所显示出来的智慧都只是虚假的表象,它能回答的问题都是预先编好程序的,它解答问题的能力也是极为有限的。总之,机器人“爱因斯坦”并不真是爱因斯坦。事实上,尽管机器人可以做许多令人惊叹的事情,比如拉小提琴、拆除炸弹、发射导弹、诊断疾病、照管番茄的生长情况以及跳舞等,但它们缺少做所有这些事情的自主性基础,它们的能力都是人类事先编制好程序的。它们能够复述笑话,但不懂笑话究竟有什么好笑;它们不能将一部电影的内容用几句话概括出来;如果没有人类给它们编制好程序,它们甚至连给自己系鞋带这么简单的事情也做不了。
而现在,美国加州大学圣迭戈分校机器感知实验室的软件设计师、心理学家哈维尔·莫韦兰领导的一个由认知科学家、工程师、发展心理学家和机器人专家组成的研究团队,希望通过破解人类智慧的奥秘,研发出能像人类孩子一样具有学习能力,能通过与外界的交流逐渐学习并掌握各种技能的机器人。
莫韦兰的机器人之梦
莫韦兰是一个西班牙果农的儿子,在有许多动物的环境中长大,他一直都想知道动物是如何想事情的。他爱问妈妈诸如此类的问题:“小狗有思想感情吗?老鼠有没有呢?”他小时候喜欢做一些自己感兴趣的“实验”,还因做“实验”损坏厨房里的东西遭到祖母的斥骂。在被20世纪60年代的电视节目《迷失太空》中的机器人迷住后,他用食品罐头、灯泡和磁带录音机制作了他的第一个“会说话的机器人”。这个机器人有一个钱币投放口,要求一次投放100美元。如果有人想用较少的钱蒙混过去,机器人就会用预先录制好的声音抗议道:“这不是100美元!”那时,他只有10岁。
1989年,莫韦兰在取得发展心理学博士学位后,在加州大学伯克利分校从事人工智能研究工作。他回忆说:“当时许多人都热衷于研究能登陆火星的机器人,几乎没人对社会型机器人的研究感兴趣,但我的兴趣不在那里,我觉得机器人技术和心理学研究之间应该有更多的交集。”1992年,他来到加州大学圣迭戈分校,开始了如何将人类的各种感知能力“复制”到机器人身上的研究。
2002年,他在日本京都的一个机器人实验室里工作,主要任务是为一个名叫“Robovie”的长臂社会型机器人编写程序。他回忆说,那时他觉得社会型机器人有些恼人,总是说“我很孤独,请拥抱我”之类的话,但日本科学家告诉他,Robovie是一款很特别的机器人。Robovie不停地跟他说话,还不时地抬头看看他。突然,Robovie双臂环绕,给了他一个拥抱。“太神奇了!”莫韦兰说,“这出乎我的意料之外,机器人强烈的感情表达让我猝不及防。”在那一刻,莫韦兰感觉这个机器人活了!
莫韦兰将Robovie机器人带进了他两岁儿子所在的学前班,想了解孩子们对机器人的奇特反应。他没想到的是,机器人的出现吓坏了孩子们。“那真是一场灾难。是我一生中最糟糕的日子之一。”莫韦兰回忆说。孩子们被相当于12岁孩子大小的机器人吓得尖叫乱跑。那天晚上他的儿子做噩梦了, 莫韦兰听到他喃喃呓语道:“可怕,太可怕了!”
回到美国后,在征求了儿子的意见后,莫韦兰重新组装了一个儿童友好型机器人,取名“鲁比”,它也是今天矗立在实验室里微笑着的小机器人的早期版本。“鲁比”身着橙色衣服,脚穿运动鞋,它的脑袋好奇地转来转去,金属身体内部填满了电机和电线。莫韦兰说:“我们从这个机器人小宝宝身上学到了很多东西。”
在过去几年中,莫韦兰给在学前班与孩子们在一起的各种“鲁比”机器人植入了研究幼儿如何回应外部世界的学习程序。有多种“鲁比”机器人,并承担着不同的任务,有的是自主机器人,有的是需要人类操纵的机器人,有的教授孩子们词汇,有的陪伴孩子们散步。虽然“鲁比”机器人需要几个大轮子,还需要大功率的马达,重达135千克,让孩子们望而生畏,但还是取得了一定的成效:孩子们在“鲁比”肚子上的屏幕上玩单词游戏,这增加了他们的词汇能力。不过,“鲁比”的人脸检测器总是将研究坦克引擎的托马斯与另一个人搞混。机器人如何在社会化环境中实现与周围人的互动,这是一个复杂的问题。而莫韦兰的宏伟目标是:创造一个能像人类婴儿一样学习的“机器人宝宝”。
像婴儿一样成长的机器人
在“爱因斯坦”的微笑检测系统里存储了几万个“微笑”或“不笑”的图像,通过将这些图像和现实中的人脸进行对照辨识,“爱因斯坦”就可以“看”到一个人是否面带微笑以及微笑的程度,然后它的语音软件就会说诸如“你的微笑很迷人”、“你为什么一脸愁容”之类的话。这种通过对大量数据进行分析,然后做出判断的学习方式被称为“监督学习”,是机器人学习中的一个很重要的方面。
然而,人类婴儿的学习方式是完全不同的。没有人会指给一个婴儿看上成千上万张脸,然后对他说“这是快乐的脸”、“这是不开心的脸”、“这是左眼”、“这是右眼”… …婴儿轻而易举地就能学会认人,特别是认妈妈的脸,一点都不会搞错,这被称作“无监督学习”。
莫韦兰的博士研究生尼古拉斯·布特科带领他的团队开发了一款“无监督学习”机器人——“贝维”。“贝维”是英文“Baby’s Eye View”的首字母缩写,意思是“宝宝看世界”。 这个看上去像洋娃娃的小机器人能够判断有没有人进入房间。它是怎么做到的呢?在“听”到有人进来的声音后,它就发出婴儿般的哭声。之后,无论是否有人发出回应声音,它都拍一张照片(在它的额头中间有一个仿佛第三只眼睛的摄像头),并对这些照片进行处理,判断其中是否出现了之前没有过的物体(人脸或人的身体)。只需6分钟,“贝维”就能判断是否有人进入了房间。
“无监督学习”方式也是“机器人一号计划”的核心研究任务之一,该计划由莫韦兰领导,旨在研发出比“贝维”更高级的机器人宝宝——它们可以通过摄像机和遍布全身的各种传感器接受外部世界的各种信息,对外部的“有趣”刺激产生好奇心,然后借鉴人类婴儿复杂的行为策略决定采取什么样的行动。研究人员对婴儿和母亲玩“躲猫猫”等游戏的动作和反应进行拍摄和研究,尽可能多地将人类婴儿的行为方式应用于机器人的“无监督学习”过程中。人类婴儿通过无数脑细胞或神经元的连接来完成这一任务,机器人则利用各种软件来模仿人类大脑的神经网络。因此,“机器人一号计划”任重道远。科学家认为,机器人最终能够拥有自主学习新东西的能力。
“无监督学习”型机器人宝宝将拥有碰触、抓取和摇动物体的能力,能“发现”人类婴儿可能遇到的多达100个不同的物体或对象,从玩具到保姆的手,并弄清楚该如何对待这些物体。外部世界的许多微妙之处,都需要它去探索、去发现。例如,一个红色的拨浪鼓和一个红色的瓶子是完全不同的两种东西,而一个红色的拨浪鼓和一个蓝色的拨浪鼓则是同一种东西。
研究人员希望机器人宝宝能像人类婴儿一样,先学会爬,然后学会行走。不过,他们最为宏伟的目标是让机器人宝宝发展出与保姆沟通的能力,例如发出信号,让保姆替它拿它自己拿不到的东西。前苏联发展心理学家维果茨基认为,运动能力是婴儿智力发展的一个重要突破点,通常在孩子大约1岁时,将经历从简单的感觉运动智力向知识符号智力过渡的阶段。如果科学家能够成功,这将是机器人做出的象征自主能力的第一个姿态,也将是人与机器人角色逆转的一个信号:机器人指挥人类(比如机器人婴儿指挥保姆),而不是人类指挥机器人。
这将是一个非常重要的过渡。科学家指出,让机器人拿取某样物体可能很困难,但机器人如果能够明白它想要什么东西,并知道借助于某个对象比如保姆,作为它拿取某样东西的工具,这将是机器人成长迈出的重要一步,因为这是一个极为复杂的心理过程。
“机器人一号计划”中的机器人宝宝的身体雏形是机器人CB2。CB2是“仿生身体的儿童机器人”的简称,这款机器人是由日本大阪实验室研发的。CB2机器人是工程学上的杰作,它拥有一双可以灵动地来回移动的黑眼睛,拥有浅灰色的硅胶皮肤,皮肤表面上有许多用来收集数据的传感器,肢体是用金属骨架和活塞驱动的肌肉构成的,像人类手脚一样灵活,而且动作配合得极好,如果手臂有动作,身体躯干和其他部分就会做出相应的回应。在2007年首次亮相时,它做出了很多与婴儿相似的动作,比如躺在地板上来回扑腾,给人的感觉是:它就像一个真正的小男孩挣扎着想爬起来。
莫韦兰选择CB2作为“机器人一号计划”中机器人身体的原型,并对其进行了一些调整,让它拥有自行行走的强大力量。莫韦兰打算去除有可能影响数据准确性的皮肤层,采用包裹在透明塑料里的金属骨架。他说:“可以让它一直穿上衣服嘛。”他还希望能将机器人做得很小,可以放在摇篮里,但设计师告诉他目前还做不到,机器人宝宝将高达0.9米,重达68千克。
机器人的脸该设计成什么样子呢?像男孩还是像女孩呢?莫韦兰之前设计的机器人宝宝都是女孩,这是他女儿的意见,而现在是要一个男孩的时候了。于是,他和他的同事汉森设计了机器人的脸部,并将它命名为“迪格”。这款“发展型类人机器人”以一个真正的孩子——莫韦兰实验室一个研究员的小侄子胖乎乎的脸蛋为原型。
机器人研究的前景展望
莫韦兰认为,虽然人类婴儿在出生之初几乎什么都不懂,但却有本能的需要,比如肚子饿了,冷了,尿布湿了要换了,都会用哭声来表达自己的要求。可这些简单的问题对于编程机器人来说却相当复杂,就如加州大学伯克利分校一位退休的心理学教授所说:“我们设计的机器人也需要排泄吗?需要按时睡眠吗?”
还有,在成长过程中,人类婴儿的认知能力是随着身体的渐渐长大一起发展起来的。那么,为了模仿人类婴儿的成长,机器人是否也将不断地改变它们的身体形态?又或者,有社会能力的机器人的模样不一定非得与人类惟妙惟肖,就像掌握了空气动力学原理后,飞机像真正的鸟一样飞上了天,但飞机的样子并不像麻雀。不过,莫韦兰认为,让机器人宝宝拥有让人喜爱的外表是很重要的,因为要让它像一个真正的孩子那样成长,就必须将它当成一个真正的孩子来对待。
莫韦兰说,当我们对人类大脑发展有了更多更深的认识,当我们一步步破解婴儿大脑解决问题的奥秘,像人类婴儿一样学习成长的机器人就会出现在我们面前。
社会型机器人
“机器人”一词于1921年开始登上世界舞台,在捷克科幻作家卡雷尔·恰佩克笔下的“人造人工厂”里,机器人首次出现。长期以来,人们对机器人的理解是:通过编程的机器,可以与周围环境互动,多数为人类从事危险的工作或繁重的体力劳动。今天世界上估计有650万个机器人或在工厂里做着平凡的工作,或在人们家里帮助做一些家务,其中有的机器人甚至能担当调制鸡尾酒之类的专门工作。
随着生活水平提高,人口出生率降低,人均寿命延长,社会和家庭生活对机器人的需求越来越大,对机器人的要求也越来越高。科学家现在正致力于将机器人与人工智能结合在一起,以开发出在社交、会话及其他能力方面和人类更像的机器人。这样的机器人被称为“社会型机器人”,它们与人类及其他机器人合作,在医疗保健、执法、婴儿看护和娱乐等领域发挥作用。我们甚至可以期望电影《摩登家庭》中的绕舌的机器人管家罗西真的出现在我们的生活中。你可以想象一下:你喝醉了酒,向酒吧里的机器人侍者倾诉自己不幸的离婚遭遇,后者扬起眉毛,同情地看着你……
机器人如何解读人类情绪
2009年2月1日,100万美国人的头脑里只有一件事——美国超级杯橄榄球大赛,由美国联合会(AFC)冠军匹兹堡钢人队对阵国家联合会(NFC)冠军亚利桑那红雀队。在纽约的一家酒店房间里,46位狂热的球迷正聚集在一起观看比赛,他们大嚼汉堡,猛灌啤酒,情绪高涨。这些体育球迷的行为本身并没有什么好奇怪的,所不同的是,他们的一举一动,甚至他们的每一次呼吸,都在各种机器的监视之下。
这是研究人员正在进行的一项实验,这些正在观看球赛的球迷们身穿配备了各种传感器的背心,实时监测着他们的心率、运动,呼吸和出汗等情况。
探查人类情绪变化是近年来传感技术的最新发展之一。多年来,一些呼叫中心的计算机对人们的声音进行监控分析,以便管理人员了解人们为什么愤怒,以及找到如何让他们平静下来顺利交流的途径;汽车内置报警器能够及时发现昏昏欲睡的司机,并提醒其保持清醒;通过卫星导航系统感受到经历堵车之人的无奈,为司机提供走出困境的替代路线;通过身体语言诊断抑郁症的医疗监测仪器也正在开发之中。机器人解读人类情绪变化的新时代正在向我们走来。
除了科幻小说中的描述之外,早在20世纪90年代中期,美国麻省理工学院的计算机科学家罗莎琳德·皮卡德就开始了机器读取人类情绪的研究,当时她的想法受到了人们的质疑,但她仍然坚持自己的想法,并于1997年出版了《情感计算》一书。她认为,如果计算机系统能感知用户的感受,就能取得更好的人机互动效果。例如电脑辅导老师如果能感知到学生情绪不高,就可像人类老师一样,或者放慢进度,或者提出有益的建议。又如可穿戴式“心情探测器”可以非常直接的方式感知人们的情绪,比如通过测量心跳、呼吸率以及皮肤电导率等变化,发现情绪波动的信号。
通过人们说话的声调来分析一个人的情绪是这类技术中最为成熟的。多年来,一些公司使用“语音分析”软件,自动监控呼叫中心代理和客户之间的对话。除了声音语调之外,研究人员还在研究如何通过对人们的姿势和面部表情的分析,来解读人们的情绪情感。
在这一领域,有许多研究小组都取得了令人瞩目的进展。他们首先“训练”计算机学会识别人的脸部特征和表情。通过一系列算法,确认脸部的眼睛、眉毛、鼻孔和嘴部的位置和特征,将这些特征保存在计算机里,计算机根据代表人类各种情绪的几十种“面部运动模式”实时解读人类情绪。例如,嘴向两边水平延伸,嘴角上扬,代表微笑,再加上眼睛区域的运动,如面颊微耸,鱼尾纹加深,表明是发自内心的笑,而非因出自礼貌而勉强表现出来的僵硬的笑。
使用这类技术,现在的计算机程序已经可以正确识别六种基本情绪:厌恶、快乐、悲伤、愤怒、恐惧和惊讶。在面部表情比较夸张的情况下,准确率可达90%以上。计算机程序甚至还可以准确判断更加微妙的情绪。在实际应用中,为了准确解读复杂的人类情感,计算机还需要参考其他一些线索,如上半身的姿态和头部运动等。而如何找到可以实时地将身体姿势和面部表情融合在一起的办法,以准确读取人的情绪,是一个极大的挑战。
研究人员正在研究如何让计算机更准确地识别人的情绪。大多数人都知道,一个装出来的笑容比真正的笑容更显夸张,而且笑容出现与笑容消失之间的转换也非常突兀。目前先进的面部表情跟踪识别技术,可以将假装出来的笑同看喜剧影片引起的发自内心的笑进行比较,从而辨别假笑和真笑之间的一些细微差别。
还有一些研究团队正致力于研究计算机检测人类情绪的另一个方面——疼痛,并取得了很大的进展,计算机区别真实的疼痛与假装的疼痛方面的能力令人惊讶。美国加州大学的一个研究团队应用面部表情识别软件区分真正的痛苦(双手放在冰水中)和假装出来的痛苦,结果计算机判断的准确率达到88%。而对170名志愿者在同样情况下进行测试,他们判断的准确率只有49%。显然,在判读人类痛苦情绪方面,人脑比电脑差远了。
研究人员还想知道计算机能否从面部表情和身体姿势辨别出人的疼痛迹象,他们希望计算机能够区分真正的生理痛苦表情和非生理原因痛苦表情,由此以更可靠的方式来评估止痛药的有效性。研究人员还开发出了针对弱势群体的情感解读技术,一种被称为“社交情感互动”的计算机软件,可帮助自闭症等感官处理障碍儿童了解其他人的情绪变化,以帮助他们更好地进行社会交流。