【摘 要】
:
针对单轨双轮机器人在静止情况下存在的固有静态不稳定问题,提出一种基于模糊强化学习(简称为Fuzzy-Q)的控制方法。首先,运用拉格朗日法建立带控制力矩陀螺的系统动力学模型
【机 构】
:
北京航空航天大学航空科学与工程学院,清华大学自动化系
【基金项目】
:
国家自然科学基金(61833016,61873295),航空人工智能专项基金(2018ZA51003)资助课题
论文部分内容阅读
针对单轨双轮机器人在静止情况下存在的固有静态不稳定问题,提出一种基于模糊强化学习(简称为Fuzzy-Q)的控制方法。首先,运用拉格朗日法建立带控制力矩陀螺的系统动力学模型。然后,在此基础上设计表格型强化学习算法,实现机器人的稳定平衡控制。最后,针对算法存在的控制精度不高和控制器输出离散等问题,采用模糊理论泛化动作空间,改善控制精度,并使控制输出连续。仿真实验表明,相较于传统强化学习方法,所提方法能够显著提高控制精度,且可以有效抑制外界干扰力矩对系统的影响,保证系统具有一定的抗干扰能力。
其他文献
本文简述了学习者可控因素,包括学习观念、学习动机和学习策略的研究情况,指出学习观念、动机和策略的研究大多为静态的、单项的研究,缺乏横向的、动态的研究。
由于信息不完全、科学理财能力缺乏等原因,我国的中小企业融资困难.为了帮助中小企业解决融资过程中的信息不透明及不对称问题,提高融资效率,发展中小企业理财服务十分必要.
行政立法程序的重要价值追求是保障公众参与行政立法的民主权利,从而增强行政立法的合法有效性.但是当前我国行政立法中的民主程序仍然不够完善,导致了行政立法在实践中的两
各向同性热解石墨作为一种典型的脆性材料,其切削加工问题非常突出,表面质量难以控制。使用PCD刀具进行切削试验,主要分析了切削速度、切削深度、进给量等切削参数以及刀具前
童年是人生最宝贵的一笔财富。童年无论是贫穷还是富有,在日复一日的岁月里都将成为生命中最诱人的磁场。通过专题阅读和专题写作两部分,引导学生采撷精神之蜜,即从别人的童
科技型中小企业是我国科技创新的重要主体,除银行信贷支持外,丰富融资渠道对于加快科技型企业发展至关重要。本文主要介绍科技型中小企业银行间债务融资情况及存在的问题,发
车间作业调度算法是影响车间生产效率的重要因素之一。由于调度算法属于NP-难问题,至今仍然没有办法在有限时间内找到最优解。文章提出了一种元启发式搜索方法:侦查包围算法(PE
【摘 要】新课程改革进入核心素养时代,对广大一线教师的教育教学实施与研究提出了挑战,原有的教师研训活动也亟待优化升级。基于“深度学习”的5T研训模式,运用线上线下相结合的方式,开展目标—主题—任务—测评的研训活动,使教师自主、深度参与研训,并思考自己在实践中的问题,为教师高效研训提供了有益的思路。 【关键词】深度学习;教师研训;线上线下;5T研训 【中图分类号】G451 【文献标志码】B 【文
本文通过对目前高校经济贸易专业双语教学必要性的探讨及现状的分析,提出了对经济贸易专业双语教学的一些建议。