论文部分内容阅读
文章以某无人艇为切入点,利用深度强化学习技术,结合无人艇的数学模型,分析并设计环境的状态空间、动作空间和奖励,通过智能控制器与环境交互生成训练样本,训练航向控制网络,同时结合以视线法为基础的航迹控制,实现无人艇的运动控制。通过实验仿真验证,训练后的网络能够很好地对无人艇进行控制,相对于传统的PID控制算法在稳定性以及抗干扰能力上具有一定优势。