移动机器人的自学习导航策略

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:guan243775020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对标准Q学习收敛较慢的缺点,采用多步Q学习算法;为解决连续过程的学习问题,采用CMAC神经网络对连续状态空间进行泛化.讨论了基于CMAC的多步Q学习算法应用于导航系统的实现方法,并与其他方法进行仿真比较,结果表明了该算法的有效性.
其他文献
计算机网络课程是电子信息类专业的一门选修课,本文针对电子信息类专业对计算机网络课程的教学需求,结合多年的教学实践,探讨教学过程中的具体做法和需注意的问题。
基于时频分布能同时分析信号在时间域和频率域的特点,针对CDMA Overlay通信系统中时变窄带干扰抑制问题,提出了一种广义的时频分布--时变换域分布,利用接收信号的时变换域分布获
提出了采用单向阀利用进排气压力波动的废气再循环(EGR)系统.应用一维非定常流动模型对该系统进行了模拟,并以此计算比较了该单向阀EGR系统的不同方案,分析了有无EGR冷却器、EG
制冷系统的蒸发温度、制冷量、输入功率、性能系数随毛细管的改变而变化,其工作特性对整个系统而言显得十分重要.因此对毛细管的流动过程建立了质量、能量和动量守恒特性方程,
提出一种基于信息结构的医学图像压缩新算法.在分析与研究以往图像压缩算法的基础上,引入了图像信息结构的概念.先确定图像的信息基因位置,再提取出图像的结构特征参数,这些
为了实现自动变进排气供油正时(AVIEIT)的新构思,以改善高速高增压柴油机的低工况性能,对自动变进排气供油正时系统的变正时机构——内置斜楔式自动调节器设计与计算的基本方法
利用修正的短轴承理论模型对转子-轴承系统在各种转速和不平衡量的情况下进行了理论与数值分析.结果表明:在某些条件下,转轴系统有可能产生倍周期分岔、拟周期分岔并出现混沌振
通过统计学中的响应曲面法建立了螺旋铣削过程中切削力的二阶模型,并分析了主轴转速、每齿进给量、轴向和径向切削深度等因素对切削力的影响.将主轴回转一个周期时的切削力波