The Cooperative Multi-agent Learning with Random Reward Values

来源 :Journal of Shanghai Jiaotong University | 被引量 : 0次 | 上传用户:dancheman001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
This paper investigated how to learn the optimal action policies in cooperative multiagent systems if the agents' rewards are random variables, and proposed a general two-stage learning algorithm for cooperative multiagent decision processes. The algo
其他文献
从潜伏期感染马立克氏病病毒(MDV)鸡淋巴组织中提取基因组DNA,采用梯度PCR的方法获得MDV的L—meq、meq基因,将其插入pMD18-T克隆载体,经测序并进行了序列分析。结果表明,L—meq、me