基于分布式机器人体系结构的逆向增强学习技术

被引量 : 0次 | 上传用户:purple601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地面自主移动机器人技术是人工智能理论研究的重点之一。为了实现移动机器人在实际环境中完成地面自主导航任务,其使用的体系结构需要把各个功能模块有机地结合起来,常用模块有感知、融合、规划、决策、行动等。而且随着技术的不断进步,地面自主移动机器人的体系结构也在不断改进。近年来,分布式控制体系结构因为其优良的适应性和鲁棒性成为机器人控制体系结构中很受重视的研究热点。基于上述理由,本文重点研究了分布式控制体系结构并在项目中的自主车辆中实现了应用。论文首先调研了地面自主移动机器人技术的发展,并根据国内外的研究现状,对地面自主移动机器人中用到的体系结构进行了分析和探讨。在上述分析探讨的基础上,本文设计并实现了一个分布式的地面自主移动机器人控制体系结构。在该体系结构中,各个功能模块被建模为对应的智能体,并将智能体分为感知、决策、动作三种类型。系统中的各个智能体分布运行于系统中不同的计算机,并通过消息传递支撑平台进行数据交换,实现协作。每个智能体具有独立的数据处理能力,各个智能体可以根据任务目标和环境的需求组成对应的异步流水线,实现机器人系统高效的运行。各种环境的实际运行实验验证了分布式机器人控制体系结构良好的适应性和鲁棒性。然后,本文结合机器学习算法中的增强学习和逆增强学习,在上述分布式机器人体系结构中实现了策略生成的学习架构。该学习架构采用逆向增强学习估计示教的回报函数。估计得到的回报被用来进行增强学习,从而求解出回报对应的最优策略。仿真实验表明,该体系结构可以生成较好的策略。此外,复杂的MDP问题中,影响环境状态的因素很多,其特征往往难以选择,而且特征空间常常是高维的。传统的逆增强学习技术一般采用人工设定的特征。本文利用降维方法,实现了回报特征的自动选取,为解决逆增强学习中特征人工设定问题,探索了新的思路。
其他文献
随着化石能源消耗与环境之间矛盾的逐步凸显,人类开始寻找清洁、可再生的新型替代能源,在此背景下风力发电迎来了发展契机,于近几年获得了飞速发展。尤其是大型风电机组发展
目的考察肝纤维化模型小鼠肝、肠微粒体对黄芩素体外葡萄糖醛酸化代谢影响和酶促反应动力学研究。方法小鼠每周3次灌胃20%CCl4油溶液,持续6周,检测血清肝功能指标ALT和AST,EL
目的评价近排腕骨切除加骨间掌、背侧神经切断术治疗退行性腕关节炎的疗效。方法1996年3月-2002年12月,对30例退行性腕关节炎行近排腕骨切除和腕部骨间掌、背侧神经切断术。
<正>一、找到自己1981年,我以全县第二的高分考取中专。报志愿时,我有恃无恐,尽拣门槛高的学校填,而录取分数低的师范,瞄都没瞄一眼。
学者们从不同的角度对重复进行了研究,但较少从语篇理解和加工的角度分析重复对于交际双方社会关系的影响。医患关系一直是人们关注的社会焦点问题,双方的交际涉及心理因素,
供应链风险评估是供应链风险管理研究中的重要内容。笔者在文献研究及调研的基础上,通过调查问卷构建了一套供应链风险评估体系,将基于支持向量机的机器学习算法运用到供应链
随着科技的飞速发展和我国社会主义建设的需要,社会对人才的要求越来越高,关注人才综合能力的发展也越来越明显,给基础教育带来了不小的压力。传统教育对人才的培养已经远远不能
人们从自然界中荷叶出淤泥而不沾水、水黾可在水上行走等现象中发现某些动植物表面具有超疏水效应,这种效应如果应用到生活和生产中,将会使人工超疏水表面具有自清洁性、防腐蚀
唇风按照病因病机可分为胃腑积热,复感风热,熏灼唇部形成的胃经风热证;素体阴虚,复感外邪,伤阴耗液,唇部失养形成的阴虚血燥证;素体虚弱,气虚不能收摄,脾虚蕴湿,复感风邪,风
随着中国金融市场的逐步开放,外资银行大量进入中国市场,导致中国商业银行业的人才流失严重,商业银行之间产生了激烈的人才竞争。如何运用各种有效措施优化人才招聘,分析雇员