基于强化学习的多Agent系统

来源 :计算机科学 | 被引量 : 0次 | 上传用户:xieym28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Reinforcement learning allows agent that has no knowledge of an environment to cooperate more efficacious each other. This paper presents an approach for developing multi-agent reinforcement learning systems based on equation principle. The experiment sho
其他文献
通过对电炉炼钢过程中不同条件、不同时期气体样进行分析,研究了电炉铁水配比、VD真空保持时间等工艺参数对钢液中氮含量变化的影响。实践表明电炉出钢氮含量随铁水配比的增
过对影响铁水脱硫的因素进行分析与讨论,发现在脱硫剂中加入适量增铝剂,用硅铝复合脱氧,会生成低熔点硅铝酸盐,有助于提高脱硫效率;铁水温度和CaO/CaF:比应分别控制在1360—1390℃与
扩展标记语言(XML)的出现,使得在异构环境下数据的交换和传输成为可能。在应用过程中,对传输中文档安全性的要求就显得异常重要。与XML紧密相关的是扩展样式表语言(XSL),其文档
通过Nb、V、Ti、Cu、Ni复合微合金化的成分设计,采用两阶段控制轧制生产工艺,八钢成功开发出风塔用Q345FTE-Z35钢板,在保证钢板强韧性的同时,获得了良好的抗层状撕裂性能,各
作者运用神经网络技术开发了一种对金融市场的现状与未来趋势进行评估的决策支持系统,并用道一琼斯工业股票价格平均指数的数据对系统进行了洲试。然后将预测的结果与传统的市
针对舞钢新轧钢厂热处理线炉底辊频繁断裂的问题,分析了现行炉底辊更换方法的优缺点,结合生产及现场实际,提出了简单易行的炉底辊在线更换方案,实现了不停炉更换炉底辊,不仅
Many compiler optimization techniques depend on which part code has been executed frequently. Profilingwill trace and record these information that a compiler n
大多数特征选择算法面临着对非一致性数据缺乏有效的处理的问题.本文提出了一种处理非一致性数据的方法,采用阈值将非一致性数据做归类处理,当某一类非一致性数据的某个取值
This paper tries to discuss one realizable mode of SW(Semantic Web). It is called NVS(Network-Virtual Society). SW is regarded as the next-generation Web. By ad
XML是当今流行的数据存储方式。传统的XML存储方式,是以流式文件的方式存储的。这样的方式有其优点.也有致命的缺点。我们基于SDML的存储方式,是以存储XML文档的结构为目的的存