两轮自平衡机器人及其递归优化控制方法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wwwlucky2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自平衡机器人的建模与控制问题是机器人学和控制科学研究的重要课题。柔性机器人能够从结构上模拟生物机体的柔性特性,其中柔性自平衡机器人是一个非线性、强耦合的系统,其建模与控制是难点。本文以课题组自行研发的柔性两轮直立式机器人为研究对象,对其建模方法、运动平衡控制方法等进行研究,取得了如下的研究成果:   第一:柔性两轮直立式机器人建模及动力学分析   本课题组研发的柔性两轮直立式机器人(Flexible Two-wheeled Up-rightRobot,简称为FWR)具有由弹簧和柔性绞链组成的腰椎,近似模拟人的腰椎特征。柔性特性使系统变得复杂,给建模和控制带来一定难度,在建模中将腰椎近似为一定长度的圆柱螺旋弹簧,运用Lagrange方程与旋转胡克定理相结合的方法,建立了FWR的动力学模型。FWR的柔性腰椎由胡克定律中的弹性系数描述,弹性系数越大对应柔性越弱。在机器人躯干与底座具有相同初始角和不同初始角两种情况下,分别对模型进行了自由倾倒和改变刚度的仿真实验,实验结果均表明所建模型与实际系统相符。通过对模型的理论分析证明,当FWR的刚度为无穷大时,其模型与刚性两轮机器人模型等价。   第二:基于LQ的FWR最优控制   本文在FWR模型的平衡位置进行麦克劳林级数展开并作线性化处理,以躯干和底座姿态角度、躯干和底座姿态角速度、移动速度、移动位移为状态量,构建了FWR的线性状态空间方程。基于此方程在六维空间中设计了FWR的线性二次型(linear quadratic,LQ)的最优控制方法,其中性能指标是由姿态角度、姿态角速度、移动位移以及移动速度等构成的累积运动误差与控制量的代数和,最优控制就是寻找一个最优控制律使其为最小。本文针对该方法进行了FWR的自由平衡、改变腰椎刚度、定点运动、恒速运动、阶跃扰动、脉冲扰动以及躯干姿态信息作为扰动的自由平衡等仿真实验,并进行了有无躯干姿态信息反馈的对比实验分析、关注不同状态量的对比实验分析、以及改变关注状态量权值的对比实验分析。仿真实验结果符合实际物理现象,系统具有良好的鲁棒性,也表明FWR的LQ最优控制方法设计是可行的。将该方法应用于实际物理系统,进行了自由平衡、定点平衡、行走、旋转等物理实验,结果表明系统具有一定鲁棒性,适用于FWR的运动平衡控制。   第三:基于LQ的FWR递归优化控制   LQ最优控制的控制对象是线性或可线性化的,而对非线性系统不能很好地进行控制。为了能更好地对具有非线性和柔性的FWR系统进行控制,并能得到更好的控制效果,本文对LQ最优控制方法进行改进,提出了基于LQ的FWR递归优化控制。该方法是将系统每一个离散时刻的状态值作为离散化的基点,实时地进行线性化处理,再通过求解Riccati方程得到该时刻的最优反馈律。本文对FWR模型在每一个离散化的基点,进行泰勒级数展开并作实时线性化处理。对FWR非线性系统进行了递归LQ最优控制,设计了基于LQ的FWR递归优化控制系统的闭环结构,并给出了FWR的实时递归LQ最优控制的逻辑流程。本文针对该方法进行了FWR的自由平衡控制、定点运动、恒速运动、阶跃扰动、脉冲扰动、躯干姿态信息作为扰动的自由平衡控制等仿真实验,并进行了关注不同状态量的对比实验、改变关注量权值的对比实验以及有无躯干状态信息反馈的对比实验,还进行了LQ与递归LQ最优控制的自由平衡控制仿真实验的对比分析。实验结果与实际物理现象相符合,系统具有良好的鲁棒性,说明数学模型与控制方法设计的合理性和正确性,仿真实验同时也验证了在刚度无穷大时FWR机器人与刚性两轮机器人是一致的。由递归LQ与LQ最优控制的比较实验表明,递归LQ最优控制比LQ最优控制可控制的角度范围更大、可控制的弹簧的刚度值更小,并且递归LQ最优控制对FWR非线性系统具有更好的控制性能和效果。   第四:基于Hopfield网络的FWR控制   递归LQ最优控制将每一个离散时刻的状态值作为离散化的基点,实时地进行线性化处理,再通过求解Riccati方程得到该时刻的最优反馈律。递归神经网络具有很强的优化计算能力,神经网络能够充分逼近任意复杂的非线性关系。针对FWR复杂的非线性系统,本文基于FWR的LQ性能指标,提出了一种基于Hopfield网络的最优控制方法。设计了基于Hopfield网络的FWR递归优化控制系统的闭环结构,并给出了FWR的实时基于Hopfield网络的最优控制的逻辑流程。该方法中将FWR的LQ性能指标转化为Hopfield网络的能量函数,由Hopfield网络的稳定性证明了该系统是渐近稳定的,当Hopfield网络的运行从初始状态到达稳定状态时能量函数达到极小,等价地系统LQ性能指标也达到极小。运用该方法进行了FWR的平衡控制仿真实验,实验结果表明,基于Hopfield网络的FWR控制器设计是合理的,同时发现了Hopfield网络会收敛到局部极小值的问题。   第五:基于Boltzmann机网络的FWR控制   针对Hopfield网络存在局部极小值的问题,本文基于FWR的LQ性能指标,提出了一种基于Boltzrnann机网络的最优控制方法。设计了基于Boltzmann机网络的FWR递归优化控制系统的闭环结构,并给出了FWR的实时基于Boltzmann机网络的最优控制的逻辑流程。该方法中将FWR的LQ的性能指标转化为Boltzmann机网络的能量函数,利用Boltzmann机网络稳定性证明了该系统是渐近稳定的。当Boltzmann机网络的运行从初始状态到达稳定状态时能量函数也达到极小,等价的系统LQ性能指标也达到极小。对该方法进行了FWR的平衡控制仿真实验,实验结果表明FWR的Boltzmann机控制器设计是可行的。同时也进行了基于Boltzmann机网络与基于Hopfield网络最优控制比较实验,发现基于Hopfield网络的FWR最优控制会收敛到局部极小值,而基于Boltzmann机网络的FWR最优控制可以收敛到全局极小值;又进行了基于Boltzmann机网络与递归LQ最优控制的比较实验,实验结果均与理论分析相一致。   本文研究的模型及控制方法给柔性两轮机器人的设计和控制提供了一定理论与技术支撑。本课题得到:国家“863计划”资助项目(2007AA042226);国家自然科学基金资助项目(60774077);北京市人才强教计划项目;高等学校博士学科点专项科研基金(63002011200601)的支持。本文所研发的柔性两轮直立式机器人已获得国际专利以及多项国家专利。论文的相关研究成果已发表在International Journal of Systems和Control and Communications国际期刊、《机器人》等国内期刊及国际重要会议论文集上。
其他文献
视频矩阵切换器是一套可以将多路视频输入信号中的任意一路或多路分别切换到一路或多路显示终端上的设备,广泛应用于各类监控场所。   传统的视频矩阵切换器多是基于51类
针对新形势下战术训练的要求和现有战术靶报靶系统存在的不足,本文提出一种新的战术靶测控系统。该系统有战术靶探测和靶标的无线控制两个部分。战术靶探测部分在嵌入式平台上
自上世纪90年代中国助学贷款兴起以来,违约现象就一直深深影响和困扰着助学贷款的发展,对此,学者们围绕影响违约现象的因素以及助学贷款的制度设计进行了深入的研究。然而绝大多
在当代社会,互联网已经成为大部分人日常生活中必不可少的一部分,为人们的工作、学习和生活带来了极大的便利。互联网上存在大量的非结构化电子文本,如新闻、博客、电子邮件、聊
随着计算机软件、硬件技术的飞速发展与成熟,仿真技术在各大领域均得到了广泛的应用和发展,水下机器人仿真便是其中一种。然而仿真将会用到及输出大量数据,如果仅以数据方式
学位
微光图像通常是在夜间等低照度条件下所获取的一类图像,具有对比度和亮度都很低的特点。智能手机、平板电脑、数字相机和航拍相机等设备的发展与广泛应用加剧了这类图像的产生
随着现代信息化战争的变革,作战力量愈来愈趋向于体系化,而多武器平台的协同作战则是作战体系的主要特征。面向新的战争形态也就有了新的技术需求,需要通过任务规划,综合考虑战场
电力电子设备的大量使用和非线性负载的不断增加致使公用电网的谐波污染日益严重。有源电力滤波器作为一种先进的优化电能质量的手段,可以提高公用电网的供电质量,而指令电流
随着人类基因组计划和多种模式生物基因组测序的完成,对于大量生物序列数据的有效处理以便寻找序列中蕴涵的信息成了目前生物信息学研究领域的热点问题之一。真核生物选择性
学位
作为一类由强化学习、最优控制和人工神经网络交叉融合产生的优化方法,自适应动态规划(Adaptive Dynamic Programming,ADP)通过模仿生物的学习机制与环境进行交互,利用交互数据