动态多智能体建模与决策问题研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:ivanc1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂的动态决策问题是人工智能领域中复杂系统研究的一个重要组成部分。本文基于贝叶斯技术和决策理论,提出一种具有更强知识表示能力的动态决策模型——多Agent动态影响图,用于动态环境中的多智能体建模;探讨了多Agent动态影响图概率分布的近似计算方法、推理算法,以及多智能体的协作问题。全文主要内容及创新之处如下:(1)给出了影响图的一种结构分解方法,将影响图分解成概率网络结构部分和效用结构部分;提出一种融合结构先验知识的MDL评分标准以降低传统MDL评分标准对数据的依赖性,并基于该评分标准提出一种PS-EM算法用于概率网络结构部分的模型选择;通过将联合效用函数表示成各个局部效用函数的和,进而构造一种用于学习局部效用函数的BP神经网络实现影响图效用结构部分的学习。实验结果表明了该模型选择方法的有效性。(2)通过对相关概率决策模型的分析,将多Agent影响图在时间上进行扩展,提出一种新决策模型——多Agent动态影响图(MADIDs),用于表示动态环境中多Agent协作关系。为了有效地计算MADIDs的概率分布,以Agents之间的策略相关性为指导,给出一种概率分布的分层分解方法,并基于KL差分对近似分布的误差进行了分析。(3)针对MADIDs的1.5片联合树精确推理算法计算复杂性高和BK近似推理算法误差大的问题,提出一种扩展的BK(EBK)算法。EBK算法通过对MADIDs的概率分布进行分层分解来提高推理的计算效率,通过引入分割团来减小算法的推理误差,并且添加了效用结点和决策结点的推理。针对粒子滤波推理算法计算上维数过高和因式粒子滤波推理算法误差过大的问题,将粒子滤波和联合树推理算法的优点相结合,提出了一种联合树因式粒子推理(JFP)算法。JFP算法将MADIDs的概率分布转变成局部因式形式以提高计算效率,并利用联合树来传播因式粒子以减少推理误差。在仿真足球机器人中的一个局部协作模型上,对上面的各种算法进行了实验验证。(4)在基于协作图实现多Agent协作方法的基础上,将角色引入协作图中给出了一种扩展的协作图,以减少协作中的通信。给出一种基于MADIDs的多Agent协作方法,通过环境的推理和局部效用的计算实现协作。通过对对手建模避免局部协作的通信。
其他文献
1病历摘要患者,男,26岁,农民,因发热、头痛7d,加重伴有寒战、高热5d入院。患者于2003年在安哥拉出劳务,在2004年3月4日在劳作中,意外造成下肢外伤,输血200ml。3月10日开始头痛,周身不
面向21 世纪的人类卫生事业正在迅猛发展,医疗卫生事业的改革不断深入,具有独特规律面向基层的社区卫生服务体系,正在逐步成立,已是新时期全球卫生体制改革关注的一个热点,成
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
关于北京政府时期的外交,尽管学术界近来已开始有了较为客观的评价,不过对于其背后因素的考察还有待深入.实际上,在北京政府时期,由于特殊的时代背景,各种社会舆论被全面动员
目的观察表柔比星联用紫杉醇或多西他赛在Ⅲ期乳腺癌新辅助化疗中的临床效果。方法选取2010年3月-2015年7月Ⅲ期乳腺癌患者226例,按治疗方法不同将其分为观察组与对照组各113
目的:探讨和总结糖尿病足的预防措施。方法:对113例糖尿病高危足患者实施足部护理、运动护理、用药护理、疾病监测、健康教育等护理措施。结果:5例发生糖尿病足,其中3例治愈,1例好
目的采用3.0T MRI磁共振成像比较健康青年人膝关节软骨T2值及厚度差异。方法将BMI指数体重指数为18.5~24kg/㎡的健康青年志愿者(18~30岁)40人进行3T MRI膝关节磁共振成像膝关节
教师是知识的传授者,是学生学习路上的指引者,每一个教师都希望自己培养出的学生是优秀的人才,但是在现实生活中,教师要想让每一个学生都变得优秀是非常困难的,因为每一个学
目的探讨康惠尔透明贴用于肝胆外科重症患者腹泻或血便引起的肛周皮肤损伤护理中的应用效果。方法将我院肝胆外科ICU 140例腹泻或血便患者随机分为观察组与对照组。观察组72
汉高华威电子有限公司(简称华威公司)前身为江苏中电华威电子股份有限公司,是国家重点高新技术企业,国家863计划成果产业化基地。华威电子集成20多年丰富的环氧模塑料制造经验及