基于定性模糊网络的分层Option算法

来源 :信息与控制 | 被引量 : 0次 | 上传用户:xiangfeng007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在强化学习的研究中,常用的知识传递方法通过抽取系统最优策略的特征获得知识,由于所获得知识通常与系统参数有关,因此这些方法难以应用于状态转移概率随系统参数变化的一类任务中。本文提出一种基于定性模糊网络的分层Option算法,该算法用定性动作描述系统的次优策略,并用定性模糊网络抽取次优策略的共同特征获得与参数无关的知识,完成知识传递,倒立摆系统的控制实验结果表明:定性模糊网络能有效地表示各种参数值不同的倒立摆系统所具有的控制规律,获取与系统参数无关的知识,将常用的知识传递方法从参数无关任务扩展到参数相关任务中
其他文献
针对铜闪速熔炼过程中的冰铜品位在线检测难题,在组元分析的基础上,研究了独立化学反应以及组分间的摩尔数关系,并建立了数学模型;但由于反应机理的复杂性与建模时的简化,冰铜品位
针对协作追逃问题的环境受限以及围捕者与目标的速度比率受限问题,提出了一种规模可扩展的机器人群体围捕移动目标的切换式策略,该策略可有效完成动态环境中目标机器人速度无约
提出了直接对实测河网进行河流编码的思想,设计并实现了基于实测河网的编码算法.解决了实测河网编码过程中出现的双线河转换、河段流量确定、拓扑结构描述等难题,提高了河流编码的实用性.通过对长江等流域的编码测试,验证了本文所提出方法的有效性.
基于小波域的多尺度数据分析,考虑微机电陀螺仪中不同类型的噪声,通过小波多尺度熵对噪声的分析,为数据融合选择了合适的小波基.从统计学的角度出发,进行实验研究,结果主要用
提出一种基于充分统计量的粒子滤波方法,用来解决粒子滤波方法在重采样过程中带来的采样粒子多样性丧失、计算量增大等问题.当系统状态的后验概率密度函数可以使用充分统计量进行描述,并且充分统计量易于更新时,该方法可通过充分统计量的传递代替后验概率密度函数的更新,从而可避免重采样过程,降低计算量.将所提方法应用于非线性系统中状态和参数的联合估计问题,进行了仿真实验,结果验证了本方法的有效性.
为减小永磁同步电机直接转矩控制系统的转矩脉动,提高系统的稳态精度和动态响应,设计了一种自适应神经模糊推理系统速度控制器,使电动机转子速度快速跟随给定值,并给出了详细
提出了一种基于加权模糊相对熵的电机转子故障模糊识别方法.该方法将加权思想引入到模糊相对熵,用于识别电机转子故障严重程度.加权方法的引入增加了信息量丰富的符号区间的模糊
为完成微小零件的装配操作,获得高效的微装配性能和避免复杂的摄像机标定工作,提出了基于BROYDEN方法的图像雅可比矩阵在线辨识模型.为了实现在线辨识快速收敛的目的,应用切比雪
根据虚拟企业的运行特点,采用分布式决策的思想,针对具有团队或强迫团队关系的虚拟企业,在允许费用超支的情况下,建立了分布式的虚拟企业风险管理决策模型.叙述了存联盟组建之初如
针对CDM GDP时隙交换问题,出一在于MAS协调的动态交易方法,以增加交换的灵活性和自主性,提高机场资源利用率,采用基于市场机制的协商策略,在SCS基础上建立了有条件的时隙拍卖交易