The Cooperative Multi-agent Learning with Random Reward Values

来源 :Journal of Shanghai Jiaotong University | 被引量 : 0次 | 上传用户:dancheman001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
This paper investigated how to learn the optimal action policies in cooperative multiagent systems if the agents' rewards are random variables, and proposed a general two-stage learning algorithm for cooperative multiagent decision processes. The algo
其他文献
<正> 一 学校教育制度的概观 日本的现代教育制度是从1872年的“学制”开始的,但在这以前日本也有过很多的现代性学校。 江户时代(1603~1868年)为了培养武士阶级的子弟,幕府(当时的中央政府)和诸藩屏设立过学习处。藩屏所设的学校称“藩校”,到明治维新时期日本全国的藩校数约达270所。 另一方面,在江户时代,武士阶级以外的一般庶民也让子弟去私塾学习。私塾是老师招20个左右小孩,教书法、念书、算盘等的小规模的一种学校,称为“寺子
A two-sided assembly line is typically found in plants producing large-sized products. Its advantages over a one-sided line and the difficulties faced in two-si
<正> 江苏省从1980年5月起首先在扬州中学进行人口教育试点,这是全国首批试点的十所中学之一。该校把人口教育作为必修课列入教学计划、排入课表进行教学,开始在高二年级上学期开设16-18课时(每周一课时)人口教育课;从1988年起又在初中二年级下学期开设人口教育课8-9课时(间周一课时),从1990年起高中改为在高一年级上学期开设。
<正> 前不久,听了一位教师教学“植物怎样‘喝水’”的自然课。课文以小林探究植物怎样喝水为线索,使学生懂得植物用根吸收水分,用导管运输水分,用气孔蒸腾水分的科学,同时使学生了解科学认识的基本程序:发现问题——做出假设——实验验证——结论。但这位教师却紧扣如下一些词句教学:“小林非常高兴——并不满足已取得的成绩——他不灰心——小林问老师。”在课堂小结时,老师还特意与同学们讨论了“应该怎样学习小林虚心好学、勇于探索的品质”的问题。而对应该掌握的基本
<正> 控制论的创立为科学方法论和哲学认识论引出了一个新的概念——黑箱(Black box或译作黑盒、暗箱、黑匣子等)。什么是“黑箱”?黑箱就是只知其输入和输出,不知其内部结构的系统。或者说黑箱是内部结构一时无法直接观测,只能从外部去认识的系统。 认识对象是否具有黑箱属性,并不完全取决于客观对象本身,与认识主体也有关系:一方面,同一客体对于不同的认识主体,由于主体拥有的经验、技术以及认识任务不同而可能
<正> 1993年4月7日至9日,中国教育学会体育研究会、中国体育科学学会学校体育专业委员会共同举办、河南大学等单位承办的全国学校体育理论青年学者学术研讨会,在古城开封召开。大会的中心议题是:1.21世纪所需要的人才与学校体育功能的研究;2.学校体育教学思想的继承、改革与发展;3.具有中国特色的学校体育管理、教学、课余训练体系都包括什么内容?来自全国17个省、市、自治区的各高等师范院校体育系、普通高校体育部,各体育
从潜伏期感染马立克氏病病毒(MDV)鸡淋巴组织中提取基因组DNA,采用梯度PCR的方法获得MDV的L—meq、meq基因,将其插入pMD18-T克隆载体,经测序并进行了序列分析。结果表明,L—meq、me
This paper introduced a novel self-adjustment of parameters of fuzzy neural networks. Then,the effects of cathode humidification temperature and anode flow rate