多智能体学习中基于知识的强化函数设计方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：ma_1001

【摘要】

：

强化函数的设计是构建多智能体学习系统的一个难点。提出了一种基于知识的强化函数设计方法，根据实际应用的特点，将经验信息和先验知识引入到强化函数中，提高了强化学习的性能。

【作者】

：

【机构】

：

西北工业大学自动控制系

【出处】

：

计算机工程与应用

【发表日期】

：

2005年3期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化函数的设计是构建多智能体学习系统的一个难点。提出了一种基于知识的强化函数设计方法，根据实际应用的特点，将经验信息和先验知识引入到强化函数中，提高了强化学习的性能。通过在Robot Soccer中的应用和实验，基于知识的强化函数的学习效果要优于传统的强化函数。

其他文献

2003年6月1日,三峡大坝正式下闸蓄水,意味着中国人梦想了百年的"世界第一坝",即将通航、发电,为中华民族走向伟大复兴提供强劲动力!

期刊

三峡工程生态环境长江防洪文物保护

普通话水平测试是一项对应试者运用普通话所达到的标准程度的检测和评定,测试一律采用口试方式进行①。这项工作主要通过普通话测评员对应试者普通话读说能力进行判断分析作

期刊

普通话测试基础语音审音

病例摘要患者,男,79岁,干部。于1979年2月始发现血沉波动在28～40mm,持续3～4年。1983年出现尿蛋白(++)并感乏力,周身关关痛(膝、肘及指关节明显),血沉增至50mm。1984年2月上述

期刊

1.概述随着城市规模的不断扩大,在城市居民生活小区的建设中,除了引用绿色生态的概念外,还在整体设计中引进了智能化居住小区的理念,以提高居民的生活质量。智能化居住小区简

期刊

考察团对药品在工厂→批发商→医院、药局、药店流通的全过程进行了全面考察,感到日本医药流通的物流体系非常发达,物流运转速度快、效率高,在这种高速运转的物流背后,是受

期刊

日本物流系统商流系统考察报告