论文部分内容阅读
将强化学习引入机械臂的避碰问题研究,建立了平面三自由度机械臂的多Agent避碰系统,系统结合了最近障碍物信息和偏差角信息来产生控制指令。采用基于K-均值聚类的强化学习方法作为基本的控制策略,给出了系统算法的具体实施过程。通过仿真试验,证明了基于聚类划分的强化学习方法在机械臂避碰问题中的可行性和有效性。