基于连接增强式学习的移动机器人控制

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:kingly1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用基于行为的控制方法,机器人在不知道外界精确模型的条件下,利用增强式学习自主完成给定的任务.机器人在学习过程中需要对行为状态进行记忆,连接增强式学习利用多层感知器逼近Q函数,泛化状态空间,节约了存储容量.仿真结果证明了这种算法的有效性,解决了基于查表增强式学习不适用连续状态空间的缺陷,为移动机器人进一步实用化提供了依据.
其他文献
基于螺旋理论和机构学中的等效方法讨论3/6-SPS Stewart机构的一般线性丛奇异.得到了满足3/6-SPS Stewart机构产生一般线性丛奇异运动学原理的星形支架作法以及代表3/6-SPS S
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难.提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法.对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段.按笔段的长度、相互之间的位置关系以及投影信息确定切分点.细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分.实验表明,本方法对于粘连手写汉字具有令人满意的切分效果.
提出了模糊触发器的概念,采用模糊事件、模糊条件和模糊动作来对触发器进行模糊推理,为在主动数据库及其应用领域表达不精确的应用语义特性提供了可行的方法.通过一个“过热警报
应用混合遗传算法(HGA)解决了生产批量及路径可变时的车间ROBUST布置问题,即用遗传算法找到一种车间布置,它在各个生产时期都是最优或接近最优的.对遗传算法操作中产生的违反
探讨了模具面向X的设计(DFX)评价数据模型,并分析其映射机制.研究了净成型件特征模型及模具集成产品信息模型,指出模具复杂因子是决定成本和时间的关键因素,给出了成本、时间
本文介绍了GPS-RTK技术的基本原理,探讨了采用GPS-RTK检核或加密测区城市导线控制点平面坐标,形成测区GPS平面控制网,采用曲面拟合的方法,实现GPS高程和水准高程之间的转换,
针对吉林省现运行的21台锅炉配备电除尘器除尘效率较低的问题,通过对其本体、电源及烟气理化指标等进行的测试、分析,提出了部分改造和整体改造方案,并对高效电除尘器、袋式除尘