基于强化学习的多Agent系统

来源 :计算机科学 | 被引量 : 0次 | 上传用户：xieym28

【摘要】

：

Reinforcement learning allows agent that has no knowledge of an environment to cooperate more efficacious each other. This paper presents an approach for develo

【作者】

：

唐文彬朱淼良

【机构】

：

浙江大学人工智能研究所杭州310027

【出处】

：

计算机科学

【发表日期】

：

2003年4期

【关键词】

：

多AGENT系统人工智能强化学习学习算法 Agent Reinforcement learning EDP Equation principle

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Reinforcement learning allows agent that has no knowledge of an environment to cooperate more efficacious each other. This paper presents an approach for developing multi-agent reinforcement learning systems based on equation principle. The experiment sho

其他文献

电炉冶炼工序钢液氮含量的控制工艺研究

通过对电炉炼钢过程中不同条件、不同时期气体样进行分析,研究了电炉铁水配比、VD真空保持时间等工艺参数对钢液中氮含量变化的影响。实践表明电炉出钢氮含量随铁水配比的增

期刊

脱氮短流程电炉铁水配比Denitrogenization Short flow EAF Hot metal proportion

KR法铁水脱硫技术研究

过对影响铁水脱硫的因素进行分析与讨论，发现在脱硫剂中加入适量增铝剂，用硅铝复合脱氧，会生成低熔点硅铝酸盐，有助于提高脱硫效率；铁水温度和CaO／CaF：比应分别控制在1360—1390℃与

期刊

KR脱硫理论分析影响因素KR desulfuration Theoretical analysis Influencing factor

基于XSLT的XML安全的应用研究

扩展标记语言(XML)的出现，使得在异构环境下数据的交换和传输成为可能。在应用过程中，对传输中文档安全性的要求就显得异常重要。与XML紧密相关的是扩展样式表语言(XSL)，其文档

期刊

XSLTXML数据文档转换样式表语言插件扩展标记语言组件安全传输编码转换功能

高韧性抗层状撕裂钢板Q345FTE-Z35的开发

通过Nb、V、Ti、Cu、Ni复合微合金化的成分设计,采用两阶段控制轧制生产工艺,八钢成功开发出风塔用Q345FTE-Z35钢板,在保证钢板强韧性的同时,获得了良好的抗层状撕裂性能,各

期刊

Q345FTE-Z35钢板控制轧制低温韧性Q345 FTE - Z35 steel plate Controlled rolling Low - te

金融市场预测的神经网络方法

作者运用神经网络技术开发了一种对金融市场的现状与未来趋势进行评估的决策支持系统，并用道一琼斯工业股票价格平均指数的数据对系统进行了洲试。然后将预测的结果与传统的市

期刊

金融市场神经网络方法道-琼斯指数均衡补偿学习法

辊底式热处理炉炉底辊在线更换检修的探索

针对舞钢新轧钢厂热处理线炉底辊频繁断裂的问题,分析了现行炉底辊更换方法的优缺点,结合生产及现场实际,提出了简单易行的炉底辊在线更换方案,实现了不停炉更换炉底辊,不仅

期刊

炉底辊断裂在线更换辊底式热处理炉Hearth roller breakage On-line replacement Roller hearth he

编译器中的edge profiling设计和实现

Many compiler optimization techniques depend on which part code has been executed frequently. Profilingwill trace and record these information that a compiler n

期刊

编译器edgeprofiling设计编译程序代码优化开放源代码Edge profiling Compiler Profiling-based o

具有非一致性数据预处理的粗糙集特征选择算法

大多数特征选择算法面临着对非一致性数据缺乏有效的处理的问题.本文提出了一种处理非一致性数据的方法,采用阈值将非一致性数据做归类处理,当某一类非一致性数据的某个取值

期刊

特征选择算法数据预处理粗糙集理论阈值记录归类非一致性问题比例Feature selection Rough set Informatio

Semantic Web,Agent和网络虚拟社会

This paper tries to discuss one realizable mode of SW(Semantic Web). It is called NVS(Network-Virtual Society). SW is regarded as the next-generation Web. By ad

期刊

SEMANTICWEBAGENT网络虚拟社会计算机网络人工智能Semantic Web Agent Network-virtual societ

基于SDML的存储块的封锁策略

XML是当今流行的数据存储方式。传统的XML存储方式，是以流式文件的方式存储的。这样的方式有其优点．也有致命的缺点。我们基于SDML的存储方式，是以存储XML文档的结构为目的的存

期刊

XML文档数据存储方式封锁流式文件并发性访问存储块克服论文策略

基于强化学习的多Agent系统

与本文相关的学术论文