论文部分内容阅读
今年六月,台湾鸿海联手日本软银以及大陆的阿里巴巴推出一款人形机器人Pepper。这款手售价约1万元人民币的机器人,首批300台在推出1分钟内就被抢购一空。Pepper具有识别表情和对话的能力,可用于导购和照顾老人病患。它是世界最著名的电子生产企业与IT风投公司、互联网公司的一次强强联合,昭示着机器人正在从科幻、科研、生产逐步走入人们的生活中。
日本暂时领先
仿生机器人是一种在外观上模仿人类或其他生物的机器人。日本人对于其中的人形机器人有着近乎狂热的追逐,全世界有四成机器人在在日本,日本也是世界上拥有机器人最多的国家。
日本在机器人方面的强大是有其深厚工业基础的,控制机器人精密动作的伺服电机主要被日本、德国、美国所垄断,其中包括了被大众熟知的松下、三菱等企业。
在日本,有非常多的公司已推出机器人成型产品,包括面向企业和大众。这些人形机器人价格不菲,从几万美元到几百万美元都有。其中最有名的当属日 本本田公司的ASIMO机器人,他外形酷似宇航员,具备听觉和视觉。ASIMO可以识别人类的面部表情和听懂人类语言,最重要的是他的手和脚都可以完成复 杂的动作。他的手可以完成拧开杯盖的动作,甚至能打出手语,双脚可离地奔跑,最高时速可达9公里。
今年CES上,东芝公司推出了一款“美女”,“她”能够实现手语交流,并拥有全球最高级的面部表达能力。可以通过43个气压传动装置提供安静、迅速、流畅的肢体运动。它的主要用途是为老人和病患提供帮助。
除日本企业外,美国也有公司在研发类似产品,其中一家名为“波士顿动力”近期开始步入公众视野,该公司成立于1992年并在前年被谷歌公司收购。波士顿动力一直与美国军方有合作,最著名的是BigDog的机器狗项目。这种机器狗可以在各种复杂地形包括光滑冰面行走,被人踹后也能保持平衡而 不倒。同时,该公司也有Atlas双足站立的机器人,也由美国军方赞助,他拥有两套视觉系统和在崎岖地形行走攀登的能力。美国企业显然是看中了机器人在战 争中搜索侦查和背驮货物的能力。
人形机器人在机械方面还存在着不少问题,由于人类四肢的复杂度,对于机械部件设计有着很高的要求。而且直立行走能力还有很大的改进空间,从近期国外举办的机器人奔跑大赛中可以看出,直立行走对于技术积累不足的企业还是很大的挑战。
鉴于日本企业几十年来在硬件上的技术积累,他们能在人形机器人上取得如此成就也就不足为奇了。这一方面让人感叹日本机械和电子工业的发展高度,另一方面也让人产生疑问:日本是不是对机器人的外观太过于执着而忽视了内在。
美国专注内在
美国企业对于仿生机器人的关心程度不如日本那样强烈。除了机械方面,美国在机器人的内在,即人工智能方面的研究,要比日本要深入得多。
早在上世纪90年代,国际商用机器公司(IBM) 就在研发专门用于国际象棋的超级电脑深蓝,这台电脑在经历首次挑战失败后,于1997年打败了当时的国际象棋冠军,名噪一时。第一次引发了人们对于未来人 工智能技术的担忧。IBM并未停下脚步,随后开发了人工智能计算机系统“沃森”(Watson)。它在2011年参加了美国的电视智力节目,并打平了两位人工对手。“沃森”的处理速度相当于每秒读完100万本书,而且并未联网,如此强大的知识储备远非人类所能比拟,它的问题主要在于对描述较少问题上的无 力。上个月沃森完成了对1900个TED公开课课程的学习,这些内容足以让一个人从生到死都学不完。
美国一家软件公司Wolfram于2009年推出问答搜索引擎Wolfram Alpha(W | A)。这一搜索引擎不同于我们通常所用的谷歌与百度,W | A会直接给出问题的答案,作为一家数学软件公司,Wolfram Alpha能轻易回答各类数学问题,解答数学问题不必借助软件,直接在搜索中求解。而且W | A还可以回答物理化学乃至人文历史等方面的问题,比如询问“现任美国总统夫人是谁”、“乔布斯的生卒日期”,W | A均能直接给出答案,从而省去了在搜索结果中自己组织答案嗯过程。W | A强大的问答系统已经被苹果公司的Siri语音助手采用。
在语音识别技术上,美国三家科技公司苹果、谷歌、微软都 在加紧布局,Siri、Google Now、Cortana三款智能语音助手已经成为各家操作系统的一大卖点。苹果Siri得益于布局早以及iOS设备较高的普及度,Google Now凭借谷歌十几年在搜索引擎上的深耕,微软Cortana则利用在PC操作系统上的霸主地位,三家各具优势,未来还将在该领域继续厮杀。
同时,谷歌、微软、Facebook等公司在图像识别领域也开始发力。以图搜图、识别图像内物品、人像识别都是图像识别的重要应用。而今年谷歌推出的Photos应用打开了图像识别技术实用化的大门,Photos智能整理照片的功能初露端倪,未来图像识别的发展方向即代替人类进行繁复的整理审查工作。
总之,与日本企业不同,自计算机技术革命以来,美国一直在软件领域处于领先地位。
在家用机器人硬件还无法进入寻常百姓家的情况下,美国企业首先在软件方面发力,依托于互联网上的云计算技术和手机、PC等现有移动设备,将“机器人”引入生活。这条道路显然比日本要好走得多。
中国暂露头角
相比日本企业对机器人的钟情,在中国国内,由于技术积累的劣势,人形机器人落后于美日等国家,仍然主要处于高校研究的阶段。
目前,哈工大、清华、上海交大等高校的机器人研究在国内颇具名气。企业方面,如新松等知名机器人公司还是以提供工业生产为主,尚未有人形的民用级产品问世。
在软件方面,中国科技企业与西方国家的差距并没有硬件那么大,诸多实用化的人工智能产品已经问世。其中,最大的中文搜索引擎百度近来在图像识别 方面奋起直追,招募了一些像吴恩达、余凯这样的人工智能专家。今年初百度也声称识别错误率上已经低于微软和谷歌。不过,本月ImageNet爆出百度作弊 的“丑闻”,让原本公布的研究成果不可信,也为百度人工智能团队抹上了一层阴影。
中国另一家科技公司——科大讯飞无疑在中文语音识别上处于领先地位。借助智能机的发展,科大讯飞推出了手机上的语音输入法和语音助手。而在这之前,该公 司的文字转语音技术就曾在北京奥运会期间投入使用。相较于美国企业,本土企业在中文语音技术上具有民族情感与政策扶持的优势,已在中国的人工智能研究中率 先展露头角。
日本暂时领先
仿生机器人是一种在外观上模仿人类或其他生物的机器人。日本人对于其中的人形机器人有着近乎狂热的追逐,全世界有四成机器人在在日本,日本也是世界上拥有机器人最多的国家。
日本在机器人方面的强大是有其深厚工业基础的,控制机器人精密动作的伺服电机主要被日本、德国、美国所垄断,其中包括了被大众熟知的松下、三菱等企业。
在日本,有非常多的公司已推出机器人成型产品,包括面向企业和大众。这些人形机器人价格不菲,从几万美元到几百万美元都有。其中最有名的当属日 本本田公司的ASIMO机器人,他外形酷似宇航员,具备听觉和视觉。ASIMO可以识别人类的面部表情和听懂人类语言,最重要的是他的手和脚都可以完成复 杂的动作。他的手可以完成拧开杯盖的动作,甚至能打出手语,双脚可离地奔跑,最高时速可达9公里。
今年CES上,东芝公司推出了一款“美女”,“她”能够实现手语交流,并拥有全球最高级的面部表达能力。可以通过43个气压传动装置提供安静、迅速、流畅的肢体运动。它的主要用途是为老人和病患提供帮助。
除日本企业外,美国也有公司在研发类似产品,其中一家名为“波士顿动力”近期开始步入公众视野,该公司成立于1992年并在前年被谷歌公司收购。波士顿动力一直与美国军方有合作,最著名的是BigDog的机器狗项目。这种机器狗可以在各种复杂地形包括光滑冰面行走,被人踹后也能保持平衡而 不倒。同时,该公司也有Atlas双足站立的机器人,也由美国军方赞助,他拥有两套视觉系统和在崎岖地形行走攀登的能力。美国企业显然是看中了机器人在战 争中搜索侦查和背驮货物的能力。
人形机器人在机械方面还存在着不少问题,由于人类四肢的复杂度,对于机械部件设计有着很高的要求。而且直立行走能力还有很大的改进空间,从近期国外举办的机器人奔跑大赛中可以看出,直立行走对于技术积累不足的企业还是很大的挑战。
鉴于日本企业几十年来在硬件上的技术积累,他们能在人形机器人上取得如此成就也就不足为奇了。这一方面让人感叹日本机械和电子工业的发展高度,另一方面也让人产生疑问:日本是不是对机器人的外观太过于执着而忽视了内在。
美国专注内在
美国企业对于仿生机器人的关心程度不如日本那样强烈。除了机械方面,美国在机器人的内在,即人工智能方面的研究,要比日本要深入得多。
早在上世纪90年代,国际商用机器公司(IBM) 就在研发专门用于国际象棋的超级电脑深蓝,这台电脑在经历首次挑战失败后,于1997年打败了当时的国际象棋冠军,名噪一时。第一次引发了人们对于未来人 工智能技术的担忧。IBM并未停下脚步,随后开发了人工智能计算机系统“沃森”(Watson)。它在2011年参加了美国的电视智力节目,并打平了两位人工对手。“沃森”的处理速度相当于每秒读完100万本书,而且并未联网,如此强大的知识储备远非人类所能比拟,它的问题主要在于对描述较少问题上的无 力。上个月沃森完成了对1900个TED公开课课程的学习,这些内容足以让一个人从生到死都学不完。
美国一家软件公司Wolfram于2009年推出问答搜索引擎Wolfram Alpha(W | A)。这一搜索引擎不同于我们通常所用的谷歌与百度,W | A会直接给出问题的答案,作为一家数学软件公司,Wolfram Alpha能轻易回答各类数学问题,解答数学问题不必借助软件,直接在搜索中求解。而且W | A还可以回答物理化学乃至人文历史等方面的问题,比如询问“现任美国总统夫人是谁”、“乔布斯的生卒日期”,W | A均能直接给出答案,从而省去了在搜索结果中自己组织答案嗯过程。W | A强大的问答系统已经被苹果公司的Siri语音助手采用。
在语音识别技术上,美国三家科技公司苹果、谷歌、微软都 在加紧布局,Siri、Google Now、Cortana三款智能语音助手已经成为各家操作系统的一大卖点。苹果Siri得益于布局早以及iOS设备较高的普及度,Google Now凭借谷歌十几年在搜索引擎上的深耕,微软Cortana则利用在PC操作系统上的霸主地位,三家各具优势,未来还将在该领域继续厮杀。
同时,谷歌、微软、Facebook等公司在图像识别领域也开始发力。以图搜图、识别图像内物品、人像识别都是图像识别的重要应用。而今年谷歌推出的Photos应用打开了图像识别技术实用化的大门,Photos智能整理照片的功能初露端倪,未来图像识别的发展方向即代替人类进行繁复的整理审查工作。
总之,与日本企业不同,自计算机技术革命以来,美国一直在软件领域处于领先地位。
在家用机器人硬件还无法进入寻常百姓家的情况下,美国企业首先在软件方面发力,依托于互联网上的云计算技术和手机、PC等现有移动设备,将“机器人”引入生活。这条道路显然比日本要好走得多。
中国暂露头角
相比日本企业对机器人的钟情,在中国国内,由于技术积累的劣势,人形机器人落后于美日等国家,仍然主要处于高校研究的阶段。
目前,哈工大、清华、上海交大等高校的机器人研究在国内颇具名气。企业方面,如新松等知名机器人公司还是以提供工业生产为主,尚未有人形的民用级产品问世。
在软件方面,中国科技企业与西方国家的差距并没有硬件那么大,诸多实用化的人工智能产品已经问世。其中,最大的中文搜索引擎百度近来在图像识别 方面奋起直追,招募了一些像吴恩达、余凯这样的人工智能专家。今年初百度也声称识别错误率上已经低于微软和谷歌。不过,本月ImageNet爆出百度作弊 的“丑闻”,让原本公布的研究成果不可信,也为百度人工智能团队抹上了一层阴影。
中国另一家科技公司——科大讯飞无疑在中文语音识别上处于领先地位。借助智能机的发展,科大讯飞推出了手机上的语音输入法和语音助手。而在这之前,该公 司的文字转语音技术就曾在北京奥运会期间投入使用。相较于美国企业,本土企业在中文语音技术上具有民族情感与政策扶持的优势,已在中国的人工智能研究中率 先展露头角。