【摘 要】
:
本文根据决策控制变换策略思想,提出一个人-机智能系统自主性变换的新方法,以解决人-机交互问题.控制变换策略由两类条件序列行动构成,即智能体转移控制决策权给另一智能体的控制行动和改变多智能体之间预定义的协调约束控制机制.为此,建立一个控制变换策略的数学模型,该模型使用Markov决策过程来构造和引导决策操作,即根据未知环境以及个体或智能群体的时间开销来选择一个优化策略.通过远程机器人的人-机交互仿真
【机 构】
:
重庆大学自动化学院(重庆);贵州电视大学理工学院(贵阳) 重庆大学自动化学院(重庆)
论文部分内容阅读
本文根据决策控制变换策略思想,提出一个人-机智能系统自主性变换的新方法,以解决人-机交互问题.控制变换策略由两类条件序列行动构成,即智能体转移控制决策权给另一智能体的控制行动和改变多智能体之间预定义的协调约束控制机制.为此,建立一个控制变换策略的数学模型,该模型使用Markov决策过程来构造和引导决策操作,即根据未知环境以及个体或智能群体的时间开销来选择一个优化策略.通过远程机器人的人-机交互仿真实验,证实了自主性变换控制模型的可行性和有效性.
其他文献
介绍了甲壳素的制备方法,阐述了甲壳素和壳聚糖的发展历史及其在纸张处理工程中的作用和应用。
中性亚硫酸盐法(NS)蒸煮芦苇是一种传统制浆方法,该法具有得率高、未漂浆白度高、易洗涤、易打浆等优点,但存在蒸煮温度高、蒸煮时间长、成浆硬度较高、漂率较高等不足。随着国际制浆造纸技术的发展和环境保护的日益严格,无元素抓( ECF)和全无抓(PCF)漂白成为当今漂白技术发展趋势。而实现制浆深度脱木素则是实施低污染漂白技术的关键。本试验通过选择适当的助剂促进芦苇中性亚硫酸盐蒸煮,希望能加快芦苇在蒸煮过
随着社会经济的发展,对纸的需求量不断增加,对木材的需求量也就不断增加,直接造成森林搜盖率的下降,也就引起了一个环境保护的问题,而废纸作为“二次纤维”,在二十世纪初就开始作为造纸工业的再生资源了,到目前欧美各国制定新的法令,都开始要求使用废纸当造纸原料,废纸再生已成为一项国际性的运动,利用废纸生产再生纸还具有减少环境污染、简化工艺流程、降低能耗等优点,不仅具有良好的经济效益也具有良好的社会效益。我国
随着我国造纸及纸制品行业的发展与技术进步,在造纸及纸制品行业中使用变性淀粉的数量和品种逐年增加和扩大。变性淀粉行业需要了解造纸及纸制品行业使用变性淀粉的目的及要求,而造纸及纸制品行业则需要了解变性淀粉的品种及其各自特点和使用方法。从而增加沟通,相互促进。为此,本文对造纸及纸制品行业使用变性淀粉的目的与要求;目前使用的变性淀粉的主要品种及特性;使用新的变性淀粉品种及特性等方面作一些简单介绍。
纤维素酶AH具有较高的内切葡聚糖酶活和很低的滤纸酶活,对纸浆具有明显的处理效果。经纤维素酶适当处理的半透明玻璃纸纸装,纸的强度没有明显变化,而纸浆的滤水性能得到很大改善。纸料在重力脱水段和真空脱水段的脱水性能都得到了提高,纸的匀度好,纸幅容易烘干,纸机车速提高。
氯烃是石蜡经深度氯化制成含氯量为68%-72%的抓化石蜡。氯烃-70又称树脂状氯化石蜡-70,为抓化石蜡的代表产品。氯蜡稍有芳香气味,挥发性较微,外观为白色或淡黄色的树脂状粉末。本文介绍了氯化石蜡的性能,制备,应用,现状与发展趋势。
在阐述航天器自主运行满足任务要求、提高系统性能、降低运行成本等方面作用的基础上,从系统的体系结构出发,按照分层递阶型、包容型、混合型三种基本形式和多智能体结构的复杂形式,分别讨论对一般轨道飞行航天器、多个航天器所组成的空间网络、以月球车为代表的星球表面探测系统和空间机器人等几类不同对象进行自主运行控制的特点,最后论述自主运行控制对智能信息处理技术的基本需求并提出有关的关键技术.
研究了存在不确定传输延时的网络控制系统的鲁棒H控制器设计问题.其中考虑传感器采用时间驱动,执行器和控制器采用事件驱动,在考虑不确定传输延时小于一个采样周期的情况下,利用线性矩阵不等式(LMI)给出了闭环网络控制系统稳定且从扰动输入到被控输出的闭环传递函数的H范数小于性能指标γ的充分条件,并给出使得性能指标γ最小化的最优H控制律的求解.最后给出仿真算例说明本文设计方法的有效性.
研究由中心刚体和柔性梁所组成的挠性航天器,不同于大多数文献只研究柔性附件的横向弯曲变形对系统动态特性的影响,同时考虑拉伸、弯曲和截面转动的影响,建立了严格的几何非线性耦合动力学模型;根据该非线性模型,在只有系统姿态与姿态速率测量值的条件下,基于能量函数选取Lyapunov函数,证明了采用PD反馈控制律能够确保非线性耦合系统姿态机动控制过程的稳定性;为了获得较好的稳态性能指标,设计了智能PID控制器
强化学习一词源于行为科学,它模仿人与动物的自然学习过程,通过对环境的反复试探,从而建立从环境状态到行为动作的映射.本文针对基于神经网络结构的机器人全局路径规划算法,利用强化学习的思想,引进评价预测学习的自适应变步长算法,实现了步长的自动调节,并且加快了路径规划的计算速度,通过仿真试验,表明了所提算法的有效性.