自主移动机器人中基于强化学习的噪声消解策略

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:flyingfish521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响.提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略.针对典型的觅食任务,以计算机仿真为手段.并与其它四种算法--基于结果奖赏和优先扫除(PS-result)、基于过程奖赏和Q学习(Q-process)、基于结果奖赏和Q学习(Q-result)和基于手工编程策略(Hand) 进行比较.研究结果表明比起其它四种算法,本文所提出的基于过程奖赏和优先扫除的强化学习算法能有效降低噪声的影响,
其他文献
摘 要:在经济高速发展的今天,作为国家产业基础的制造业,对生产型数控机床的需求不断增长,且缺口极大。而对中小企业而言,采购满足生产的数控机床整机费用太高,难以承受。而机床数控化改造作为绿色制造的一种新方式,具有节约资源,降低成本,减少碳排放的效果。本文分析了数控化改造的必要性,又以CL6140型普通车床的改造为例,探索车床数控化改造。  关键词:数控化改造;必要性;普通机床;CL6140型普通车床
摘 要:在经济飞速发展进程中,企业对人才素质的要求也不断提升,在人才录用方面,除了要对人才的理论水平有所要求之外,还对人才实践能力和操作水平提出了较高层次的标准。由于会计电算化对实践非常注重,因此,在教学的过程中,应该深入研究会计电算化的有效教学策略,以培养更多优质的实用型会计人才。  关键词:校企合作 会计电算化 教学策略  中图分类号:G64 文献标识码:A 文章编号:1672-3791(20
摘 要:计算旋转面或旋转体的质心是力学中的一类常见问题,解决这一类问题经常出现微分量表达式写错的情况。本文分析了这一问题产生的原因,并给出了解决这一问题的比较简便的夹逼准则方法。通过用夹逼准则方法分析旋转面或旋转体的质心计算问题,发现计算旋转面的质心时,应把微元看成圆台,而计算旋转体的质心时,应把微元看成圆柱。  关键词:质心 微元法 夹逼准则  中图分类号:O313.3 文献标识码:A 文章编号
摘 要:根据云教育平台的相关特点,进行云平台环境下的历史课堂教学模式构建,不断开发和拓展中学历史课堂教学的新模式和新思路,为学生创造一个极具探索和创新的实践学习环境,以最大限度的激发中学生的学习主动性和积极性,让历史教学内容更加多样化和形象性,既符合教育教学的发展要求,也能够满足中学生的个性化学习需求。为此,本文将对云平台环境下的历史课堂教学进行研究分析,以期给相关研究者以有益借鉴。  关键词:云
简述了用于环保压缩机装配线上的装配机器人。在对机器人运动学分析基础上,基于OpenGL实现了对装配机器人的仿真,便于装配机器人工作时进行轨迹规划。而且开发了环保压缩机装配机器人的离线编程系统,使用性能优良。操作界面友好,成为机器人系统实际应用的有力工具。
利用原设计的厂房地坪基层作为模板支撑架体的地基,高支模架体采用统筹考虑二层层间梁的支设和三层梁模板支撑的设计。依据二层层间梁与三层梁的不同位置关系对立杆进行精心
针对旧桥拓宽工程中新旧桥梁基础的沉降不均匀的问题,为了有效降低由于新旧桥梁沉降的时间差所带来的不利影响,以某空心板梁桥为背景,提出了在新旧桥梁连接前对新桥的桥面板
摘 要:本文通过对多层次外语实验教学体系的探索与实践,探讨了在当前形势下外语类实验教学的教学理念、教学思路、教学方法以及外语实验教学课程建设,提出了“三层次四模块”的外语实验教学新体系。通过对外语通用性和专业性人才进行不同层次的培养提出思考和建议,对于新形式下外语类实验教学体系的建设有积极的参考意义。  关键词:多层次;外语教学;实验体系  中图分类号:G642文献标志码:A文章编号:2095-9
摘 要:IVT可增大传动比的变化范围,提高传动系统的效率。本文提出6种基于IVT的双电机混合动力构型,建立了6种传动系统的数学模型。分析了每种构型在低速和高速模式下速比特性和功率循环特性。探明了每种构型的传动特点。选择出一种最适合混合动力传动系统的构型。为IVT在混合动力汽车上的应用奠定基础。  关键词:IVT 混合动力汽车 功率流 行星轮系  中图分类号:TV381 文献标识码:A 文章编号:1
网络仿真是网络研究的重要手段。NS2是一种开放源代码的网络仿真器,广泛应用于网络协议的设计与验证。本文针对无线网络中TCP协议性能低下的问题,提出了一种改进的基于TCP拥塞控制机制,简称TCP-Yuelu。该机制通过对瓶颈链路队列长度的测量与预测,区分网络随机错误和网络拥塞丢包,同时,利用带宽测量结果作为网络发送速度调节尺度的依据,对不同的丢包原因采取不同的调节策略,改进了TCP窗口加性增加乘性减