分布式任务自主分配和协同控制

被引量 : 0次 | 上传用户:yhmlivefor47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着多Agent技术的迅速发展,Agent自主决策能力在不断增强,为了弥补多Agent的集中式体系结构缺点,多Agent分布式的体系结构是一个重要发展方向,而且将分布式体系结构下的多Agent技术运用到解决复杂问题的决策是分布式人工智能的一个研究热点。一般而言,问题的决策环境往往具有突发性、不确定性和动态性等特点,这就需要根据环境的变化进行动态决策。本文针对动态变化环境下,对分布式体系结构下的多Agent任务分配和协同控制技术展开研究,阐述了在动态环境下任务分配和协同控制的特点。本文将动态环境的复杂任务决策问题划分为任务分配层和任务执行层两个层次。其中,任务分配层利用随机博弈论建立了动态任务分配模型,并给出了相应算法,通过计算分配方案,实现任务的优化分配;任务执行层利用马尔科夫决策理论建立协同控制模型,并给出相应算法。通过计算协同规则,对任务执行过程中的动作协作进行指导。在任务分配层中,使用强化学习算法对随机博弈论任务模型进行求解,算法中,各个Agent根据Nash-Q值选择最优任务。当在环境动态变化时,能够反复动态调整任务分配,能提高多Agent任务分配的有效性。在任务执行层中,使用SHV-IP算法对MAS分布式马尔科夫决策模型进行求解。SHV-IP算法首先在模型状态空间中的初始状态和目标状态之间,寻找一条能遍历其他所有具有较高立即报酬状态的最短哈密顿路径,通过最短哈密顿路径指导寻找最优的协同策略,由于避免了所有状态的搜索,减少了协同模型的状态空间,从而降低协同控制的难度。本文对提出的随机博弈任务分配模型和分布式马尔科夫决策模型分别进行仿真,仿真结果表明本文提出的随机博弈任务分配模型和分布式马尔科夫决策模型对动态环境具有良好的的适应性。最后,本文将动态环境下任务的动态分配与任务执行过程中协同控制结合起来,用来解决动态环境的问题决策。仿真结果表明,本文提出的方法能有效适应动态环境问题决策,对于动态决策理论和方法研究有一定借鉴意义。
其他文献
《国家中长期教育改革和发展规划纲要(2010-2020)》指出,要加大培养适应农业和农村发展需要的农业生产能手,增强涉农专业的发展比例,不断发展带有农业气息的职业教育,使得职
目的 中医认为“脾主运化”,“脾为后天之本,主运化水谷精微”,说明脾具有消化和吸收营养物质,并将其散布于全身,使脏腑经络,四肢百骸及筋肉组织得到营养,以进行正常的生理活动的
目的:研究我国外资医院药学服务模式的创新点,总结先进经验,促进药学服务的发展。方法:采用归纳分析法、调研法和实地考察法,调研了我国具有代表性的3家外资医院药学服务的内
本文借鉴西方新修辞学家肯尼斯·伯克的认同理论,分析奥巴马两次胜选演讲的修辞策略。分别从同情认同、对立认同和误同三方面解读奥巴马是如何运用这种“制造同意”的策略来
导演许秦豪说:“《春逝》是韩国四十年代特流行的一个歌名,从片名顾名思义,春就是青春,逝就是流逝,从这个主题出发,所以拍了一个年轻人的恋爱故事。我看过中国的很多唐诗,有
随着互联网迅速发展,网络营销行业竞争日趋白热化。严酷的市场环境使网络营销公司既要应对同行的竞争,也要面临战略目标、业务模式和成本管理不相容的问题。基于上述情况,网络营销公司除提高自身业务能力扩大市场份额外,还需引进先进的成本管理方式,加强成本管控,从内部提高公司竞争力和抗风险能力。本文以WJ网络营销公司为研究对象,运用比较分析法和定性定量相结合法,通过分析业务流程、组织架构和财务状况,找出公司在核
国外视频公开课在我国引起的强大反响催生了我国的视频公开课。我国的大学视频公开课同时向高校学生和社会大众开放,强调学科内容的通读性和应用性。大学物理是理工科学生的基
受耕地制约和"低补偿、重安置"水利工程征地补偿和移民安置政策局限的影响,江苏省水利工程移民现行"社会保障安置",既不能保障"生产生活恢复"水利工程移民安置政策目标的实现
背景:肺癌的发生、发展、转移及预后与机体免疫功能及肿瘤的免疫逃逸机制密切相关。目前临床常规放化疗对肺癌中晚期患者的疗效低、副作用大,不能有效提高患者的生存率。近年来
砷是一种众所周知的有毒物质,由于含砷工业废水的排放、矿类开采等人类活动的频繁,使得有些地区的地下水中砷的含量增高,加快了砷在环境中的迁移和转化,造成了砷在环境中的积累,引