3D扫描世界蓄势待发

来源 :电子产品世界 | 被引量 : 0次 | 上传用户:qzccj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  当年微软开发Kinect 3D传感器的时候,其中一个关键性的任务就是校准算法,以便迅速、准确地识别人体各部位,尤其是手部,以确保Kinect适用于任何家庭环境,任何年龄的人群,任何穿着和任何背景物。使用基于计算机的方法做校准具有其局限性,原因在于在Kinect生成的图像中电脑可能无法识别手部,或错误地识别了手部的存在。因此,微软此前宣布要向全人类求助,借助亚马逊的土耳其机器人完成图像标记识别。这是一个在线的服务,公众通过执行简单但计算机不擅长的任务而获得报酬。结果,Kinect现在能识别所有(或大多数)样子的手。这实在太棒了!
  当然,如果你唯一关心的只是基于手部动作的游戏,你会认为这是一个天大的好消息,但是从商业机器人角度看,手部只是我们需要机器识别的成千上万的“东西”之一。试想一下,如果一个机器人能迅速地识别家里、办公室或工厂里的任何对象:机器人看到或接触的任何东西都能被马上识别出来。这才是个真正伟大的进步。
  所以问题是:我们能不能实现这一目标?我们可以用某种方式自动识别或依靠公众识别一切潜在的对象吗?
  这种类型的数据收集涉及到一个先有鸡还是先有蛋的问题:如果你有一个对象均被恰当标记的数据库,基于存储在数据库的“知识系统”,你便可以开始构建各类应用程序,而这些应用程序反过来又可以生成更多的数据,让你进一步完善数据库的“知识系统”。问题是,你第一步需要一个数据库!有时候,企业会认为建立这套数据库是很有价值的。比如Kinect之于微软。另一个例子是谷歌的“语音指令”,通过语音让系统执行搜索、发电子邮件以及其他任务。每次你说出一个词,你的Android手机就会问:“你的意思是……吗?”然后提供一个字词列表供你选择想要表达的意思,在这个过程中,你帮助完善了谷歌得语音识别系统。随着时间的推移,不同人讲话模式的变化和细节都会作为语音数据被捕获,使数据库更贴近实际的语言使用习惯。没有这种持续改进,语音到文本将永远不会成为一个智能便利的应用。
  现在回到机器人技术的问题上。我认为机器人研究团体应更加关注数据的重要性。机器人技术涉及的很多东西都需要一个大规模的数据库(需要强调大规模),以实现技术上的可行性(譬如对象识别),因此这项功能不能依赖纯理论研究、机器人专家或算法,而必须掌握“切向技术”的市场趋势,例如网络或智能手机。因此,为了让机器人技术能有实现的一天,我们需要关注具有收集海量数据能力的技术,为了机器人技术以外的需求,也为了在技术成熟的时候把它应用在机器人技术上。
  其实,我们最需要的数据类型是3D数据。那么,我们该如何收集每一个潜在对象的3D数据呢?幸运的是,一个大规模的关于Kinect感应器的骇客社区,以及像MatterPort这样的创业公司正在实现快速3D渲染技术,只需要使用Kinect从几个角度拍摄对象不同的图像就可以实现。这项技术现在还不成熟,不过随着传感器和算法的改进,你能预见用3D技术再现一个场景就会像拍一张照片般容易。其他能够同时补抓光的强度和角度、允许用户在已经拍好的照片重新调焦的技术,如Lytro和其他“计算机摄像头”,同样可以实现 3D图像的生成。
  正如我在上文提到,机器人专家不可能单独完成所有的3D扫描。我们希望其他技术能推动这一趋势的发展。因此,这里是一个想法。如果在线零售商看到通过展示商品细致3D模型带动销售的商业价值(而不是过去我们在网站看到的二维图像),并为图像标记诸如颜色、重量、功能的描述,那么成千上万的物品原则上都能被机器搜索。Google在2010年的IEEE机器人与仿生学国际会议上提出过一个相似的想法,并在去年五月的Google I/O开发者大会重申了这个见解。也许不仅网络零售商能供应3D扫描,消费者也可以,只要他们意识到在eBay上传3D图像进行销售是更有效的生财之道。
  


  如果这种情况成为现实,那么所有的3D图像将可以聚合成一个的数据库,让机器人可以便捷地使用它作为参考。一个机器人将收集眼前一个物体的3D传感数据,然后与参考图像进行匹配。随着时间的推移和反馈数据(譬如“是的,罗西,这是一个盘子”)的累积,机器人的目标识别能力将不断提高。
  所以,如果你想要更智能的机器人,你应该开始要求在线零售商提供其产品的3D扫描, 并开始创建自己的扫描。有了这些数据,机器人终有一天能够认识和理解世界上我们熟悉的东西。(文章授权来自于国际电子电气工程师协会《Spectrum》期刊)
其他文献
由德州仪器(TI)DLP(数字光学处理技术)产品事业部举办的“2012 DLP创新论坛”近日在京举行。TI高级副总裁兼DLP产品事业部总经理Kent Novak介绍了DLP的四大业务:影院、前投、微投以及嵌入式投影。  微投增长最快  微投主要三大类产品:DLP、LCoS(硅基液晶)和其他MEMS。Kent称TI占有超过70%的微投市场。微投也是TI DLP所有产品部门里成长最快的。TI看好此市场
期刊
TRIFIA 2012年清华-罗姆国际产学连携论坛于4月28日在清华罗姆电子馆召开,来自清华和罗姆专家学者跟与会者分享了与罗姆合作以来在某些领域取得的成果。会后,罗姆株式会社常务董事高须秀视先生和清华电子工程系主任王希勤教授介绍了罗姆和清华在产学研方面的相关合作。  清华的罗姆电子馆是罗姆株式会社在日本以外捐资建的第一栋楼,高须秀视先生说,中国是全球最大的消费电子市场,罗姆非常重视这一市场,未来将
期刊
在第八届中国国际国防电子展览会期间,由《电子产品世界》杂志社主办、以“面向连接时代的高性能高可靠性连接器应用”为主题的第七届国际连接器技术与产业发展论坛(ICTF2012),于5月9日下午在北京展览馆报告厅成功召开。来自连接器行业的分析专家、代表厂商和许多电子工程师参加了此次论坛。  此次论坛的探讨围绕高可靠性连接器应用趋势、航空航天连接器应用技巧、高品质材料最新发展趋势等内容展开,参加演讲的嘉宾
期刊
汉江奇迹  今天一提起世界电子公司,人们很自然会想到美国的苹果,自上世纪90年代末,它开发销售的一系列“i”产品,引领全球时髦电子产品的潮流,推动着世界电子工业的前进。公司赚得翻倒,几多风流在,光辉映日月,成为业界崇拜偶像,唯苹果马首是瞻,跟风模仿唯恐落后。但窃以为,苹果公司成功主要依靠的是:个人的才华、灵光的闪现、天才的创新、精英的领导。其实,更值得世界电子业界学习推崇的公司、竞争者更可怕的对手
期刊
据南京航空航天大学自动化学院教授黄文新博士介绍,十几年前,普通应用场合的电机控制很简单,接一个开关和电源,电机就转起来了,变频的需求也不大,对控制的精度要求也不高。但是现在家庭中的空调、洗衣机、冰箱、跑步机等需要变频,这样效率高,特别是节能,同时企业采用变频,表明其技术处于产业前沿。工业上的变频更普及,尤其是新能源汽车的电机驱动,对电机业提出了巨大的挑战。  电机有很多种(图1),如果要变频,正弦
期刊
摘要:本文分析了采用无传感器BLDC的优势,及低成本应用的具体实现方法。  关键词:无传感器;BLDC;电机控制;低成本  DOI: 10.3969/j.issn.1005-5517.2012.9.002  电机在我们日常生活中的几乎每个部分发挥着作用。它们驱动洗碗机和洗衣机,使室内变得凉爽,并且对于现代交通工具更是必不可少。无刷直流(BLDC)电机已成为许多匀速或变速的高可靠性中高档系统的选择。
期刊
摘要:探讨了3D手势识别需要的技术。  关键词:手势识别;3D视觉;DSP  DOI: 10.3969/j.issn.1005-5517.2012.9.003  随着触摸屏技术的不断推广,用户已经适应并逐渐熟悉了与机器的互动。现在,人机互动技术已迈上了更高的台阶,进入了手势识别时代,不过这也并不是一帆风顺的。手势识别现已在娱乐及游戏市场出现,然而这种技术将对我们的日常生活产生怎样的影响呢?不妨假想
期刊
摘要:使用高频开关稳压器时,好的汽车电源PCB布线可以提供更干净的输出,并且简化EMI测试中的调试工作。本文以MAX16903/MAX16904开关稳压器设计为例,介绍如何布线以获得最佳性能,并降低辐射。  关键词:汽车;DC-DC;电源;高频汽车电源;2MHz电源  DOI: 10.3969/j.issn.1005-5517.2012.9.010  布线通用规则  (1)将输入电容C3、电感L1
期刊
摘要:锁相环是现代通信系统的基本构建模块,而电源噪声越来越影响锁相环性能。本文通过列举多种电源管理电路设计的新方法,解析不同的设计对锁相环性能产生的影响。  关键词:ADI;锁相环;滤波器  DOI: 10.3969/j.issn.1005-5517.2012.9.011  锁相环(PLL)是现代通信系统的基本构建模块。PLL通常用于在无线电设备中提供本振(LO)功能,也可用于时钟信号分配和降噪,
期刊
引言  UWB天线与传统的窄带天线相比有很多新的特点。信号源产生一定形状的短脉冲并将其馈入超宽带天线,天线要将脉冲信号无失真地辐射出去,因为频域内任何一个频点的失真都会使得接收到的信号脉冲产生不同程度的失真。所以,UWB天线的特征有别于一般的微带天线。此外,FCC规定民用UWB的-10dB带宽范围为3.1~10.6GHz,在此频段内天线的增益、波瓣方向图、驻波比等参数应在允许的波动范围内。  对于
期刊