基于智能引擎技术的多移动机器人路径规划

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:hudie8707180910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的飞速发展,具有高智能性移动机器人的研究受到了国内外研究者的广泛青睐。路径规划是机器人智能控制技术中的一个重要问题,具有智能学习能力的路径规划算法的研究,为机器人在实际环境中的成功应用奠定了一定的基础。本文主要对单移动机器人在静态未知环境下和多移动机器人在动态未知环境下的路径规划问题进行了研究:  首先,给出了一种结合k-最近邻(k-NearestNeighbor,kNN)分类法与Sarsa(λ)强化学习算法(即kNN-Sarsa(λ)算法)的移动机器人路径规划方法,该方法可以得到大规模连续状态的离散化表达形式,从而有效缓解大状态空间中路径规划算法收敛速度慢和维数灾问题。基于kNN-Sarsa(λ)算法的移动机器人路径规划方法虽然收敛速度快,但该方法容易陷入局部最优值。为此,通过引入随机扰动(RandomPerturbation,RP)对动作选择策略进行改进,提出了一种基于随机扰动RPkNN-Sarsa(λ)强化学习的移动机器人路径规划算法。仿真结果表明,该方法有效提高了kNN-Sarsa(λ)算法的全局寻优能力。  其次,针对实际环境中机器人传感器探测数据存在不确定性这一问题,将传感器探测信息的不确定性用基于Bayesian规则的概率形式表示,并将其与POMDP(PartiallyObservableMarkovDecisionProgress)模型的信念状态更新相结合。将基于POMDP模型的路径规划问题转换为基于信念状态的MDP问题,给出了一种基于信念状态的kNN-Sarsa(λ)算法。该方法利用基于k最近邻分类法的局部值迭代学习模型,对迭代次数进行优化。仿真结果表明,基于信念状态的kNN-Sarsa(λ)算法,能够缓解传统POMDP模型求解方法带来的收敛速度慢和计算复杂性高的问题。  最后,针对多移动机器人系统运行环境的动态性,本文结合强化学习对动态环境有很好适应性的特点,给出了一种基于强化学习的完全分布式多移动机器人协调控制系统。利用强化学习算法来解决多移动机器人协调路径规划问题,将强化学习的回报函数设计为基于行为分解的无模型非均匀结构形式。仿真结果表明,该方法有效缓解了多移动机器人强化学习中存在的维数灾问题。
其他文献
全波形反演以其高精度高分辨率的反演特点成为了近年来地震勘探的研究热点,并在石油、天然气等勘探领域具有重大应用前景。但是,全波形反演成像效果严重受制于不精确的初始模
语音是人类通信时最重要的信息载体,历来受到人们的重视。语音信号的处理经历了从模拟到数字的技术变革,然而语音数字化后给系统数据的存储和传输造成了很大的压力,因此语音
TD-LTE是我国拥有自主知识产权的3G标准TD-SCDMA的后续演进技术,旨在满足用户对日益增长的高质量移动多媒体服务的需求。OFDM、MIMO技术因在高速数据传输中具有良好的抗多径衰
当前灾害频发,但救援人员在救援现场的工作安全情况却一直没有有效的监测措施。如果能够在各种危险场合及时准确地监测救援人员的工作位置和工作状态,如人员在建筑物内的具体
LTE(Long Term Evolution)是全IP(Internet Protocol)的分组交换网络,以往2G、3G等电路域交换网络上的语音通话技术在LTE上已经不能够适用,因此需要一种新的全分组域的语音通
分形作为非线性科学的重要分支之一,其理论和方法在雷达、声纳、无线通讯、射电天文等诸多领域得到了广泛的应用研究。在前人研究成果的基础上,本文着重对海杂波的分形特性及其
随着无线通信业务的高速发展,频谱资源的严重不足日益成为遏制无线通信事业发展的瓶颈,感知无线电(CR)技术由于能有效提高频谱利用率而备受关注。传统的感知无线电技术需要检测
无线自组网是由一组自带无线收发装置的移动节点组成的无线网络系统。无线MAC协议处在无线自组网的较低层,它决定节点接入信道的方式。由于自组网的无中心、自治自愈、节点移
目前,果蔬生鲜等农副产品在网上逐渐热卖,本课题以水果为例进行研究,主要围绕两个问题展开:一是如何让用户快速在网上商城选择心仪的水果;二是水果如何搭配吃才更健康合理。
距离信息的获取是计算机视觉领域非常热门的研究方向之一,PMD(PotonicMixer Device)相机可以实时高效的获得目标的距离信息,然而存在随机噪声较大,水平分辨率低、缺少表面信息等局