点对点鲁棒迭代学习控制及其性能优化算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:wangy3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迭代学习控制是一种广泛应用于执行重复任务的高性能控制方法,其直接根据之前批次的系统输入输出信息不断修正更新当前批次的控制输入信号,最终在有限时间内实现对参考轨迹的完全跟踪。将优化理论与迭代学习控制技术相结合,能够得到最优型学习控制器以实现快速跟踪。然而在实际的工业过程中,系统输出往往不需要跟踪完整的参考轨迹,只需要在某些特定时间点处跟踪上给定的参考值。例如机器人的“取”和“放”操作,只需要专注于拾取点与放置点的输出,其它时间点的输出往往无需多加考虑。值得注意的是,在设计控制器时往往会有很多不确定因素,例如控制器输入约束、被控系统模型存在建模不确定性以及系统运行初始条件发生偏移等。因此,综合考虑实际应用中可能存在的多种复杂控制问题,为了进一步改善迭代学习控制器控制精度和收敛速度,展开了对点对点迭代学习控制及其性能优化算法的研究。本文的研究内容如下。(1)针对一类线性离散系统的点对点跟踪问题,将优化理论与迭代学习控制技术相结合提出了一种范数最优点对点迭代学习控制算法。通过输入输出时间序列矩阵模型变换构建综合性多目标点性能指标函数,求解二次型最优解得到优化迭代学习控制律,同时给出了标称模型和乘性不确定性模型情形下所提算法最大奇异值形式鲁棒单调收敛的充分条件,并进一步根据凸优化理论得到输入约束下的的控制算法。最后,通过数值仿真实例验证了算法的合理性及有效性。(2)针对一类加性不确定性线性离散系统,在不确定性有界的假设下首先提出了结构奇异值分析法并得到了范数最优点对点迭代学习控制算法的鲁棒单调收敛条件。但是限于结构奇异值分析法的局限性,无法最大化利用点对点跟踪任务的灵活性,进一步提出了一种适用性更广的鲁棒点对点迭代学习控制算法,在最坏情况下将设计问题转换为凸优化问题并求解得到最优控制输入信号。最后,通过数值仿真验证了算法的合理性及有效性。(3)针对一类初始条件随批次变化的线性离散迭代学习控制系统,初始条件随批次变化通常会降低传统迭代学习控制算法的性能,为此提出了一种最坏情况下的鲁棒范数最优点对点迭代学习控制方法。所提算法考虑了初始条件随批次变化并将设计问题转化为优化问题,利用拉格朗日对偶函数将优化问题转化为凸优化问题,通过求解凸优化问题得到最优控制输入信号,并进一步证明了所提鲁棒算法等价于具有变增益的传统范数最优点对点迭代学习算法。最后,通过数值仿真验证了算法的合理性及有效性。
其他文献
近年来,随着科技的不断进步发展,移动机器人相关技术已逐步在人类实际生活与生产过程中发挥重要作用,相关行业领域对于移动机器人的性能需求也愈发迫切。自主位姿估计与运动控制作为移动机器人在未知环境中完成工作任务的技术基础,近些年来引起了国内外学者的广泛关注。针对移动机器人在复杂环境下的实际功能需求,本文利用单目视觉、IMU与轮式里程计实时传感信息,进行移动机器人多传感信息融合位姿估计与速度控制研究。首先
经济社会的发展和生产力的提高促使机器人的应用越来越广泛,随着传感器技术的进步,机器人系统拥有了更加强大的探测和感知能力,大大推动了机器人应用技术的发展。但当前大部分的移动机器人在进行自主导航的过程中,其数据源严重依赖于单一传感器,且存在总线协议不统一、实时性差、应用较为复杂等问题。因此本课题基于ROS平台和EtherCAT通讯技术,将轮式里程计、激光雷达和深度相机等传感器进行融合,搭建了一个能够完
Takagi-Sugeno-Kang(TSK)模糊系统的特点是能使用线性模型的方法求解非线性模型。TSK模糊系统的这个特点使得其在众多的领域都受到了广泛的关注。但是,与其它有监督学习一样,TSK模糊系统需要充足的信息。然而,在真实世界的应用中,训练数据经常是有限的,而模型也不能充分的挖掘数据中的信息,因此很容易导致过拟合问题。现有的TSK模糊系统方法,更多的把目光放在了模型结构的研究上,忽视了实际
RNA结合蛋白(RBP)是一类伴随RNA调控代谢过程,且与RNA结合的蛋白质的总称。一种RBP可能存在多种靶标RNA,其表达缺陷会造成多种疾病。通过寻找功能结构相似的RBP可以为治疗癌症等疾病的RNA疗法提供帮助。在RBP识别的过程中,一个关键的步骤是获取RNA有效特征和使用RBP之间的结合相似性网络来学习它们之间的联系。本文针对上述描述的RBP识别提出了两个多视角多标签特征学习的新策略,较已有的
在复杂工业过程中,对运行中的某些关键变量进行实时监控具有重要的意义,然而受到技术条件有限、检测装置昂贵以及现场环境恶劣等不利因素的影响,这些变量难以利用硬件传感器检测得到。在这种情况下,软测量技术得到应用,通过训练集构建数学模型,实现对新样本质量变量的实时估计。软测量技术通常需要大量有标记样本才能完成高精度模型训练,然而在实际工业过程中常常是无标记样本数量较多,有标记样本数量稀少,且获取成本高。因
音频携带了城市中大量关于日常环境、生活场景和物理事件的信息。通过深度学习方法智能分类识别出各个声源并提供相应的运用与服务,在构建智慧城市中具有巨大的潜力与应用前景。其被广泛运用于噪音监控、城市安防、多媒体信息检索、智慧工厂等方面。但当前已有的城市音频分类模型仍存在分类准确率不够高、泛化能力不够强以及噪音鲁棒性较弱等问题,针对上述问题论文进行了如下研究:(1)为解决城市音频分类领域中现有模型分类准确
多自主体系统协调控制是近几十年的热门研究领域,其研究成果大量应用于无人机编队飞行、无线传感网络和多机器人协调控制等工程领域。一致性控制是多自主体系统协调控制的分支研究领域,控制目标是通过自主体之间的控制协议,利用局部的信息,使所有自主体状态趋于一致。而固定时间一致性控制,要求所有自主体在固定时间内实现状态一致,比传统一致性控制收敛速度更快。在实际工程环境中,干扰和非线性动态会影响系统稳定性,是不可
孪生支持向量回归机(Twin Support Vector Regression,TSVR)是一种解决回归问题的机器学习算法。由于TSVR只需求解一对规模较小的二次规划问题,其训练效率高于支持向量回归机,因此TSVR已逐渐成为机器学习领域的研究热点。但是,目前TSVR的训练算法大部分都只是离线训练算法,无法高效处理在线增量学习问题。本课题致力于提升TSVR三种变体在增量环境下的训练效率,设计其相应
近年来,多自主体系统一致性问题已成为学术界的研究热点,并在传感网络、航天探测以及电力能源等领域得到了广泛应用。一致性问题是指利用自主体的局部交互信息设计合适的控制协议,使所有自主体的状态最终达到相同。为了节约有限的资源,事件触发控制策略被应用到一致性协议中。在事件触发控制中,只有当测量误差触发函数超过预设阈值时,自主体才进行通信和控制器更新。为顺应通信环境的要求,事件触发一致性问题的研究逐渐从固定
视频行为识别就是在不需要人为干预的情况下,综合利用计算机视觉、模式识别、图像处理、人工智能等诸多方面的知识和技术对摄像机拍录的图像序列进行自动分析,实现动态场景中的人体定位、跟踪和识别,并在此基础上分析和判断人的行为,其最终目标是通过对行为特征数据的分析来获取行为的语义描述与理解。视频行为识别技术可用于自动驾驶、人机交互、智能安防监控、智能家居监护等领域。因此,对视频行为识别的研究有着重要而广泛的