【摘 要】
:
超冗余度连续体机器人因具有灵活的多自由度,在复杂受限空间内具有出色介入能力。此类机器人一般由绳索驱动,在长时间工作后,由于制作、磨损、绳索变形等因素易导致理论模型偏离实际工况,进而导致控制精度下降。因而,基于先验知识的控制器设计,往往不能维持其设计初期的控制性能。为解决这一问题,本文基于强化学习算法,对连续体机器人末端位置控制展开研究,主要工作如下:(1)建立了柔性致动评价的理论基础,通过调研,探
论文部分内容阅读
超冗余度连续体机器人因具有灵活的多自由度,在复杂受限空间内具有出色介入能力。此类机器人一般由绳索驱动,在长时间工作后,由于制作、磨损、绳索变形等因素易导致理论模型偏离实际工况,进而导致控制精度下降。因而,基于先验知识的控制器设计,往往不能维持其设计初期的控制性能。为解决这一问题,本文基于强化学习算法,对连续体机器人末端位置控制展开研究,主要工作如下:(1)建立了柔性致动评价的理论基础,通过调研,探讨了无模型和有模型两类方法的优缺点,并分析对比值函数迭代、策略梯度等优化方法。在此基础上,讨论了深度强化学习和最大熵理论。(2)对超冗余度连续体末端位置控制过程进行了强化学习建模,针对连续体状态输入和动作输出维度空间较高,训练难以直接收敛问题,基于柔性致动评价算法(Soft Actor-Critic,SAC),设计网络结构,并探索训练方法。在稀疏回报问题处理上,引入由末端位置、行为引导和动作惩罚三方面组成的奖励函数,根据训练过程对回报函数动态调整,引导加速网络收敛。针对连续体多自由度导致的最优Q值多模分布情况,结合SAC动作熵设计,引入探索噪声,使得动作有限制随机化。建立连续体仿真环境,验证SAC算法控制可行性,并对算法控制性能展开分析。(3)针对SAC算法数据利用率低下问题,引入底部集成状态转移神经网络模型,结合模型预测控制和交叉熵方法对推理决策部分进行设计,建立基于模型的轨迹采样方法(MBTS),并在仿真中对算法可行性进行验证。在状态转移模型方面,分别对比数学模型与网络模型控制效果差异,探究超参数对于控制效果影响,分析不同控制区域目标点到达成功率,并对推理决策层稳定性开展验证。通过增加误差偏置,对比了网络模型和数学模型对于实际模型因磨损、变形等因素导致模型改变情况下的适应能力。(4)根据模型轨迹采样方法,在连续体实体机器人上开展算法验证实验。搭建由运动捕捉系统等硬件组成的实验平台,建立TCP通信机制。在控制算法应用方面,分别使用数学模型和网络模型完成圆运动轨迹规划与实体验证;通过少量训练迭代,基于MBTS完成复杂轨迹运动规划,并在连续体机器人上进行实体验证,在XYZ三方向均达到了1cm以内的控制精度。
其他文献
数控机床作为制造业的核心,在社会生产的各行各业中应用广泛。刀具作为数控机床的关键部件之一,其在加工过程中由于与工件和切屑之间的挤压摩擦,会逐渐产生磨损,当磨损量达到一定值后刀具磨钝失效,失效刀具需要及时更换,否则会影响加工产品的质量和生产效率,甚至造成生产事故,因此对刀具磨损状态进行在线监测评估至关重要。为实现刀具磨损状态的稳定有效监测评估,本文首先分析了刀具磨损的产生机理及工况条件对刀具磨损的影
软材料可在外界能场作用下发生显著大变形,包括伸长、弯曲、扭转等基本运动形式,可用作软体机器人的驱动单元。基于微结构的超材料具备传统材料难以实现的机械和力学性能,比如可调节杨氏模量、负泊松比、轻质高刚度等。微结构与软材料的结合为软体驱动器和机器人的设计提供了新思路,可望实现复杂变形可编程设计,成为近年来的前沿热点。但是,由于几何结构、多材料、驱动的强耦合作用和在大变形下的高度非线性特性,目前仍缺乏系
大口径射电望远镜是进行空间探测、航天测控的重要设备,拟建设的新疆奇台QTT-110m射电望远镜将成为世界最大的全向可动射电望远镜。大口径会使得望远镜更容易发生结构上的变形,因此大口径射电望远镜一般配备有主动主反射面系统,用以对拼装而成的主反射面进行实时调整,确保射电望远镜的精度。促动器作为高精度位移装置,是维持射电望远镜主动主反射面面型与精度的重要装置,需要常年保持高精度。即将用于新疆110m射电
随着人们生活品质的不断提高,消费者的个性化需求日益强烈,制造业面临着转型升级,向小批量、灵活化的生产方式发展。部署灵活、操作简单的协作机器人是这些产业快速实现自动化的绝佳选择,因此协作机器人在近年来发展迅猛。灵活性、易用性与安全性作为协作机器人的核心竞争力,主要体现在机器人的拖动示教与碰撞检测应用上。本课题针对这两项关键应用进行研究,提出了一种基于底座力传感器的方式来实现高精度的碰撞检测与灵活的拖
三维点云是一种重要的数据结构,能够提供比图像更加丰富的几何信息。随着传感技术的不断提高以及深度学习在三维领域的不断突破,基于点云的深度学习方法成为了许多工业自动化应用中的一种全新的解决方案。物体位姿估计是许多场景感知应用的关键,对光照和纹理信息不敏感的点云数据逐渐地发挥了重要的作用。本文围绕具体的机器人散乱抓取应用,针对非结构环境下的堆叠工件,提出了一种基于点云模型的物体位姿估计深度学习方法,其主
近年来AGV在生活生产自动化方面得到了广泛的使用。在使用过程中,给AGV进行充电是一个必经的步骤,手动有线充电是当前绝大多数AGV的充电方式,手动操作降低了生活、生产使用中的自动化程度,增加了人工操作的步骤,在部分环境下存在安全隐患。使用自动无线充电作为AGV充电方式可以有效减少充电流程的不便性和不安全性,提高AGV的环境适应性和实用性,也节约了人工步骤所需的人力成本。目前无线充电技术中,电磁感应
植株表型参数是作物品种选育中判断品种优劣的重要依据。目前,植株表型测量大多依靠人工完成,效率低,误差大,且易对植株本身造成破坏。由于植株形态多变,交叠遮挡,基于二维图像分析的表型测量也难以反映完整的植株表型信息,易造成信息失真。因此,搭建植株表型3D识别装置,建立高精度、自动化、全生长周期的植株表型无损测量方法,是还原植株生长过程,高效获取植株表型参数,加速作物品种选育的重要基础。本文首先针对农学