论文部分内容阅读
研究对象是具有如下特征的复杂管理系统:(1)由于Agent之间的相互作用,系统中存在不同的局域。从宏观上看这些局域足够小,使得系统中包括了足够多的局域;从微观上看这些局域足够大,使得局域内含有一定数量相互作用的Agent。(2)在短的time-scale中,处于不同局域之间的Agent之间的相互作用关系为非合作随机微分博弈,而处于同一局域内的Agent之间的相互作用是合作随机微分博弈,且博弈的状态、特征与性质由系统的拓扑结构影响。局域内的合作随机微分博弈使得该局域内Agent行为同步,局域间Agent的非合作随机微分博弈使得系统内Agent行为不同步。(3)在长的time-scale中,由于Agent的智能性、自治性和社会性,在优先连接、增长和衰退三个机制下,Agent根据系统状态自适应地调节博弈的局部拓扑结构,以使得系统创新。研究目的:确定这一复杂管理系统演化过程中系统内Agent在某一时刻可能采用的最佳策略、最佳策略的分布特征以及该最佳策略可能持续时间的分布特征、临界状态,从而使得管理者能够管理该系统的运行及Agent行为,并使系统可持续发展。研究过程与方法:(1)在短的time-scale中,对于局域内Agent的合作随机微分博弈,首先将整个局域看成一个整体,考虑该局域收益最优化下各个Agent的最优策略,然后再将所设计的调整后动态Shapley收益分配向量作为收益分配机制,以达到局域内Agent行为的同步。对于局域之间Agent的非合作随机微分博弈,将其抽象成局域与局域之间相互作用,将局域抽象成Super-Agent,考虑各个Super-Agent的非合作随机微分博弈的反馈Nash均衡解。在合作/非合作随机微分博弈最优策略及其最佳收益确定的前提上,构造了一个非线性算子,使得局域内Agent的合作随机微分博弈的Pareto最优策略轨迹与局域之间Super-Agent之间非合作随机微分博弈的Nash最优策略轨迹有效地耦合在一起,从而确定系统中Agent的最优策略轨迹及相应的收益特征。随即讨论了这一最优策略轨迹的收敛性,确定了这一短time-scale的确定系统拓扑结构内最优策略轨迹的吸引子。(2)在长的time-scale中,将Agent相互作用的拓扑空间结构、Agent行为、环境特征综合考虑形成一个行为-结构共演化的随机过程,针对复杂管理系统的特征,将这一随机过程分成了Agent行为更新、在同一局域内创建新的相互作用、与其他局域内Agent创建新的相互作用、删除系统已有的相互作用、与新进入系统的Agent建立相互作用、删除系统中的Agent等6个子过程,将这6个子过程通过以Agent收益驱动的优先连接机制与易变机制支配下形成的在长的time-scale中对应的总随机过程,分析这一共演化过程的分布特征,从而确定系统中最优策略轨迹吸引子的分布特征。(3)分析了受到外部干扰时系统个体Agent从系统中消失而给系统拓扑结构造成的影响,采用逾渗理论,分析随机删除一定数量的Agent以及按照收益从大到小重排序之后蓄意删除收益最大的一定数量的Agent之后系统的连通性,并根据系统的连通程度确定系统逾渗的临界状态及临界概率,从而给出了系统可持续稳定发展的基本条件。研究结果:(1)在短的time-scale中,系统中的Agent在合作/非合作随机微分博弈这一过程中确定自己的最优策略轨迹。(2)在长的time-scale中,系统中的Agent按照自身收益的大小,在优先连接、与易变机制驱动下按照最优策略的不变分布特征确定自己的策略行为,从而使得系统发展变化。(3)这一系统在演化过程中,面对随机攻击,系统表现出很强的鲁棒性,面对蓄意攻击,系统表现出很强的脆性。研究结论:(1)在短的time-scale中,通过非线性耦合算子确定的合作/非合作随机微分博弈的最优策略轨迹既能够保证在同一个局域内的Agent行为达到协调,使得整个局域收益最大,也能使得系统中各个局域处于均衡状态;系统中Agent之间的合作/非合作随机微分博弈耦合下的最优策略收敛到一个确定稳定的吸引子,这一吸引子决定着在这一短的time-scale中系统Agent的最优均衡策略的变化趋势。(2)在较长time-scale中,复杂管理系统是Agent行为和系统拓扑结构共演化下的一个系统,这个系统表现出马尔科夫属性,其不变分布由系统中Agent的行为、系统的拓扑结构以及系统中Agent的总量和噪声所决定;当系统中Agent行为的噪声趋向于无穷小时,不变分布以大偏离原则收敛到以一个特定的率函数有关的一个区域中,此时,与所有的Agent策略有关的系统状态处于一个(,)相关均衡状态;而在系统中Agent总量趋向于无穷大这一极限下,不变分布以大偏离原则收敛到以率函数r (, q)有关的一个区域上。(3)当系统受到随机攻击时,系统中至少存在两个大组分将系统连通;而系统受到蓄意攻击时,其删除概率有一个临界点,在临界点之下,系统中至少有两个大组分使得系统得以连通,而在临界点之上,系统中只能有一个大组分,这一大组分内绝大多数Agent孤立,并且,这一临界点与系统中Agent收益的特征有关。