论文部分内容阅读
多传感器信息融合使得合作工作变得愈来愈复杂,多智能体如何在真实复杂的环境下相互协调完成不同的任务,也成为了新的研究热点。智能体之间的相互合作是保证其能在一起工作的核心。合作不仅能提高智能体所形成的智能系统的性能,亦能增强其解决实际问题的能力。因此研究多智能体相互之间的合作是开发多智能体系统的必然需求。近年来,通过博弈论研究多实体合作行为的实验,对于智能体的合作研究产生了深远影响。例如:马克斯-普朗克研究所的米林斯基合作演化博弈实验,瑞士苏黎世大学和圣加伦大学进行的公共物品博弈实验,乃至大卫·兰德的重复性囚徒困境实验等。这些研究对进化动力学、合作演化、群体内资源分配均有着一定的贡献。本文借鉴了以上关于多智能体合作演化的研究,以复杂网络博弈动力学为核心,通过在复杂网络中引入动态博弈机制,以网络内的智能群体合作为研究对象,仿真分析了多智能体间的合作演化过程。本文主要工作有:1.首先研究多智能体中的行为一致性对囚徒困境博弈合作演化的影响。研究表明:在智能群体中引入行为一致性机制,能够使群体合作率的变化幅度变小,且能够使得多智能体在合作演化中有着更高的合作密度。2.考虑声望机制对于合作演化的影响,在网络上仿真分析存在一定程度的惩罚和奖励的公共物品博弈实验。研究表明:道德约束能促进群体凝聚力,以抑制智能群体中的背叛行为。并进一步在BA网络中进行铲雪博弈实验,在合作个体初始化时数量不变的情况下,考虑群体间的强互惠行为,通过对相邻个体声望值进行判断,并以此为依据对背叛行为进行惩罚,可以使参与铲雪博弈的智能个体产生一定程度的合作。并在后续中研究了对高声望个体进行惩罚这一行为对多智能体合作演化的影响。3.在囚徒困境博弈仿真实验中,分析强互惠机制和行为一致性机制对群体合作演化的影响。研究表明:在BA无标度社区网络中,存在行为一致性机制时,智能个体可以在网络中演化出一定程度的合作现象。在强互惠个体的影响下,能使演化博弈在达到演化均衡状态时具有着更高的合作密度,然而更高的合作密度需要个体支出一定的增益来维持。以上均以复杂网络为基础,采用立体连接的方式,将智能个体相联系。并在智能群体间,进行博弈演化仿真实验。通过对仿真所得的数据进行分析,研究强互惠机制和行为一致性机制对多智能体合作的内在影响。对于未来多智能体系统的开发有着一定的意义。