仿生水下机器人的增强学习控制方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：muzhe8835

【摘要】

：

仿生水下机器人是近年来水下机器人领域的研究热点之一。仿生水下机器人复杂的动力学特性和不确定的工作环境使得其运动控制问题非常具有挑战性,直接影响着整体性能的提升。

【作者】

：

林龙信

【出处】

：

国防科学技术大学

【发表日期】

：

2010年期

【关键词】

：

仿生水下机器人波动鳍增强学习神经Q学习连续状态-动作空间姿态镇定轨迹跟踪运动控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

仿生水下机器人是近年来水下机器人领域的研究热点之一。仿生水下机器人复杂的动力学特性和不确定的工作环境使得其运动控制问题非常具有挑战性,直接影响着整体性能的提升。本文针对一类双波动鳍配置的仿生水下机器人,基于在增强学习框架下解决其运动控制问题的研究思路,围绕运动控制问题分析、增强学习算法构建、增强学习姿态镇定、增强学习轨迹跟踪以及试验验证等几方面内容展开研究,主要工作和研究成果包括:(1)从仿生学启示、仿生波动鳍和仿生水下机器人的动力学特性等角度对一类双波动鳍配置仿生水下机器人的运动控制问题进行了系统分析。研究了仿生对象的外部形态和游动特性,基于仿生学启示设计了仿生波动鳍推进器和仿生水下机器人“双仿生波动鳍+双摆动鳍+双自由度仿生鳔”组合推进控制方案,针对实际物理装置开展了仿生波动鳍和仿生水下机器人的推力试验和运动试验,获取了相关的动力学特性,为仿生水下机器人运动控制方法的设计提供了指导。(2)针对机器人控制的实际需求和基本Q学习算法的局限性,提出了一种面向实际机器人控制应用的连续状态-动作空间神经Q学习算法(CSANQL算法),综合利用前馈神经网络、学习样本数据库、Q值估计拟合函数、以及基本Q学习算法,实现了在连续状态和连续动作之间的快速有效映射。研究了神经Q学习算法的两种实现结构,揭示了基于Q值估计拟合函数实现连续动作的机理,分析了学习样本数据库在提高算法学习效率方面的作用,阐明了增强学习算法与仿生水下机器人运动控制的结合途径,为仿生水下机器人增强学习控制方法的研究奠定了基础。(3)针对仿生水下机器人的姿态镇定问题,从学习优化和学习控制两个层次提出并设计实现了增强学习自适应PID控制、增强学习控制和监督增强学习控制等三种增强学习姿态镇定方法。研究了基于增强学习的参数自适应机制,分析了学习样本数据库和监督控制在增强学习控制方法中的重要作用,并通过仿真对增强学习控制方法在姿态镇定问题中的有效性进行了初步验证。结果表明,增强学习自适应PID控制器能够主动学习最优的PID控制器参数,具有较好的姿态镇定性能;以CSANQL算法为基础的增强学习控制器的性能受学习样本数据库的影响,当学习样本数据库容量适当时能够有效实现姿态镇定目标;监督控制的引入,加快了学习的收敛速度,确保了学习过程尤其是学习初期输出动作的稳定性,使得监督增强学习控制器具有比增强学习自适应PID控制器和增强学习控制器更好的姿态镇定性能。(4)针对仿生水下机器人的轨迹跟踪问题,提出并设计实现了一种基于增强学习行为的行为控制结构。从复杂的轨迹跟踪任务中提取推进、偏航和定深等三个基本控制行为作为实现各种轨迹跟踪任务的基础,设计了基于增强学习控制方法的基本控制行为,提出了基于增强学习的行为组合优化方法,并围绕三维空间中的直线轨迹跟踪和曲线轨迹跟踪任务开展了仿真研究。结果表明,增强学习行为控制结构能够快速响应目标运动轨迹,在复杂的多通道轨迹跟踪任务中也具有较好的跟踪控制性能。(5)基于研究组自行研制的仿生水下机器人试验系统,开展了仿生水下机器人增强学习控制方法的试验研究,从姿态镇定和轨迹跟踪两方面进一步验证了论文提出的增强学习控制方法的有效性。研究表明,基于CSANQL算法的监督增强学习控制器具有比单纯增强学习控制器或传统PID控制器更好的姿态镇定性能;在基于增强学习行为的行为控制结构作用下,仿生水下机器人能够较好地跟踪设定的轨迹跟踪任务。上述研究工作和成果在仿生水下机器人的运动控制问题和增强学习控制方法的实际应用方面进行了有益探索,为在增强学习框架下最终实现仿生水下机器人的高效自主运动控制奠定了基础。

其他文献

谈体育教师的身体哲学运思

人对＂自身＂的反思中,更加关注身体与现实的参与和表达,在现实和认知两者之间随着历史的演变逻辑意蕴日趋多元,催生了身体与思维意识的多重反思,而当今的体育教学中,更多关注与

期刊

体育教师身体哲学运思意识唤醒

分层教学背景下,初中数学小组合作学习有效评价的研究

在初中数学教学中,采用分层教学并在其背景下采用小组合作学习方式,可以优化学生的学习过程,提高教学质量.在这个过程当中,有效的评价不可或缺.研究学生的认知水平与个性差异

期刊

初中数学分层教学小组合作有效评价

2003-2007年我院门诊工作发展状况及分析

目的通过对近几年我院门诊发展状况的总结,更好地促进我院门诊工作的发展. 方法对2003-2007年我院5年门诊工作报表中的门诊诊疗人次进行统计分析. 结果 5年来门诊诊疗人次

期刊

门诊工作发展状况门诊诊疗人次平均增长速度统计分析就医需求服务水平总结群众结果方法报表

尊重视域下高中生学习期望研究

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

学位

学习期望尊重生活世界家庭教育生涯指导

村落体育的终结、价值与未来

在竞技化、产业化和城市化的背景下,村落体育的终结似乎不可避免。运用文献资料法与逻辑分析法,对村落体育的终结、价值与未来进行了研究,以期更好地传承与发展村落体育。主

期刊

村落体育终结价值未来village sportsfinalityvaluefuture

纪念我的老师汪菊渊先生

我的老师汪菊渊先生已经离开我们10年了，但是他的音容笑貌却永远清晰地留在我的心中，永远也不会淡忘。1952年，在我国高等院校的招生院系专业名单中，第一次出现了“造园专业”这个

期刊

老师纪念北京农业大学高等院校造园招生学生

设计作品的形成及其参考点

通过对古典设计、现代设计、后现代设计及当前风行的设计风格及流派的形成和发展加以总结和研究,从思想、美学、场所、技术发展等诸项影响设计的参考点上加以剖析,试图追根溯

期刊

风景园林哲学思想参考点形象符号landscape architecture philosophy reference point image symbo

仿生水下机器人的增强学习控制方法研究

其他学术论文