论文部分内容阅读
针对变电站巡检机器人在传统运动规划方法下存在的难以规划出平滑路径、不确定环境下动作不可测等问题,提出研究不确定条件下的变电站巡检机器人运动规划问题的深度强化学习方法.文中分析了深度学习中奖励值模型Ⅱ、探索策略和神经网络结构对整个运动规划的影响,设计了不同结构的神经网络,并开展了相关的对比实验.结果表明,在当前任务场景下,相同的运算量神经网络结构C2比神经网络结构C1和神经网络结构C3的计算时间要短.因此,在计算资源短缺时,建议采用神经网络结构C2,更有利于对变电站巡检机器人进行精准的运动规划,提高自动化控制效率.