论文部分内容阅读
                            
                            
                                随着机器人技术与人工智能学科的不断发展进步,机器人学展现出了广阔的运用场景,同时它代表着当今智能信息处理技术、自动化控制技术、系统集成等技术的最新发展。机器人的运动规划与控制作为机器人学的重要组成部分,具有十分重要的研究价值。本文对现有机器人在复杂环境下的路径规划、模糊控制、轨迹跟踪问题进行了系统的研究,主要工作总结如下:1.提出了基于多智能体进化的分层3D路径规划算法。以遗传算法、模拟退火算法和粒子群优化算法为代表的元启发式算法被广泛运用于路径规划问题。这些算法被普遍认为在性能、可扩展性和易于实现性等方面权衡后的最佳方法。但是这些方法具有计算量大、收敛速度慢的缺点。针对此,我们基于多智能体进化计算提出一种分层3D路径规划算法,在优化过程中,算法对不同分辨率的3D地图使用了逐层优化的策略,并设计竞争和自学习算子提高算法的局部搜索能力,分层递归优化过程可以大大减少计算量并有效地处理环境的动态特性。实验结果表明,该方法可以有效降低计算量,并加快收敛速度。2.提出了基于双模型深度强化学习的运动控制算法。在使用神经网络学习对机器人进行控制时,深度强化学习方法通常需要大量采样,导致学习的效率十分低下,这严重限制了该方法在许多实际任务中的运用。我们把控制移动平衡的神经网络称为智能体,基于此提出一种使用双模型(预言家和评论家网络)的算法来指导智能体的学习过程。先验机器人模型和移动参考路径构成了可用于指导智能体学习的预言家模块。无模型强化学习算法中的评论家模块可以进一步用于增强智能体能力并弥补环境模型引起的偏差,预言家模块可以减少现实任务中与环境的交互过程。实验表明,在无模型的强化学习过程中使用动力学模型进行规划是一种提高训练效率的有效方法。3.针对四旋翼飞行器的特殊动力学模型,提出了基于非线性PD轨迹跟踪算法。四旋翼飞行器作为一种特殊移动机器被广泛的运用于各个领域,传统的PID系列方法使用误差的线性组合的控制方式难以从根本上实现对轨迹的高精度跟踪。我们针对此,提出了一种双闭环的控制方法。在外环位置空间控制中,通过误差以及姿态解析计算输出一个关于空间误差比例和微分的非线性推力控制量;在内环姿态控制中,通过结合四旋翼飞行器模型计算出关于姿态误差的非线性角速度控制量。最后将非线性推力控制量和角速度控制量相结合完成3D路径跟踪控制。实验结果表明,该方法可以有效获得高精度的跟踪轨迹。