论文部分内容阅读
发育机器人的研究目标是使得机器人具有类似于人类及其它生物的感知、行为、学习和决策等方面的能力,从而协助人类在动态环境下完成各种复杂的任务。向自然学习是研究发育机器人的根本出路,具有婴儿发育能力的机器人是这项研究的首要目标。1977年,美国感知心理学家J.J.Gibson提出了Affordance理论,并且认为婴儿首先是学习物体的affordance,然后才学习其颜色、大小等特征。Affordance理论在21世纪初被引入到发育机器人领域,被描述为“潜在动作”。潜在动作建立了机器人和环境之间可能的动作关联,它由当前任务、机器人自身的能力和环境的本质属性共同决定。机器人的感知目标不再是物体的颜色、形状等特征,而是“可抓取、可推动”等动作属性。潜在动作研究的重点是学习机器人和环境之间可能的动作关联,应用它们来完成不同的任务,并且在执行任务的过程中不断提升机器人的感知、行为和学习等能力。本文首先介绍了婴儿发育、内在动机等发育机器人的基础理论,分析了自主心智发育、形态发育、潜在动作等主要研究途径,并且从环境感知与交互的角度将婴儿从出生到2岁的潜在动作学习过程分为五个阶段,前三个阶段均属于面向简单任务的交互,后两个阶段的交互复杂性逐渐增加。接着,综述了潜在动作的研究现状。全文的重点是用机器人模拟这五个阶段的潜在动作学习方法,其主要贡献如下:(1)从发育机器人的角度定义了潜在动作,设计了面向简单任务的三种潜在动作模型及学习方法,这三种模型的功能逐渐增强。“从离散状态到动作”的模型使用动机函数来描述动作关联的奖励值,“从连续状态到动作”的模型使用函数拟合来建立状态空间的动作映射。“视听结合的动作推理”模型通过语音来抽象地表示视觉和动作信息,采用表格关联的方式来推导尝未用语音描述的信息,减少了“人-机器人”交互时需要的参数,将机器人的潜在动作学习方式从单维度扩充到了两个维度。(2)提出了面向子任务的潜在动作预测方法及其形式化描述。该方法通过任务分解和状态抽象机制来降低整个任务的求解空间,通过整合子任务策略和目标无关的潜在动作来预测动态环境下的潜在动作,将潜在动作的影响范围由传统的应激式、反应式原子动作提升到了子任务决策的高度。机器人导航实验表明,这种“动态特性的潜在动作”比传统的“静态特性的潜在动作”更能提升机器人的任务执行效率。(3)提出了基于共享信息的多机器人潜在动作匹配方法。该方法从功能属性的角度来描述机器人,使用共享机制来增加机器人的信息来源。因此,机器人不一定需要与物体实际接触就可以匹配潜在动作。多机器人协同搬运的实验表明,该方法的效率要高于非基于潜在动作的方法。(4)开发了一款用于研究潜在动作的仿真软件CogRSim。CogRSim的重点是潜在动作的检测与执行模块,其特色是三维场景的二维同步显示、多个物体可以自由组合成具有统一物理属性的任意形状。软件的可用性通过单机器人、多机器人的潜在动作实验得到了验证。