一种通过强化学习的四旋翼姿态控制算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:nana119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出通过深度强化学习实现四旋翼姿态控制.通过对深度强化学习中的近端策略优化实现姿态稳定的控制学习任务.飞行器直接通过神经网络进行训练,直接将状态输入映射到控制输出.其次提出一种崭新的算法通过将传统的控制模型引入来提高强化学习算法的训练速度.经过实验验证,该算法可以有效控制四旋翼在任意姿态下的稳定性,且该算法可以在比一般强化学习方法更具泛用性更快收敛.
其他文献
江苏省信息技术学科2020年开始执行《普通高中信息技术课程标准(2017年版)》(以下简称新课标),这意味着本年度入学的学生将要在2021年底参加学测。俗话说:凡事预则立,不预则废。新标准、新教材背景下,如何确保学生顺利通过合格性考试,需要学校、教师、学生及早谋划,在变与不变中找到应对之策。新课标将信息处理过程中隐含的信息意识、计算思维、数字化学习与创新、信息社会责任作为学科核心素养重点凸显了出来。
本文提出了一种结合模糊逻辑的灰狼优化算法.本文利用模糊逻辑对灰狼算法的收敛性和多样性进行改进,在狼群迭代过程中加入对多样性度量和误差度量的性能考量,设计了可实现参数动态自适应的模糊规则,从而使算法能够在寻优过程中实时调整收敛速度并提高求解精度.首先,利用30、64和128维度的基准数学函数表明该方法的可行性,然后引用假设检验表明方法的有效性,最后将其应用于柔性外骨骼机器人姿态数据的聚类分析.实验结果表明,在分析的基准函数上,该方法比原始灰狼算法以及其它模糊灰狼算法的性能更好,在姿态数据的聚类上,基于该方法