多人博弈模型的合作现象研究

论文部分内容阅读

社会群体中的竞争与合作行为是复杂和重要的实际问题。研究自私个体构成的群体中的博弈与合作性质及其行为特征一直是人们关注的课题。博弈理论提供了描述这些现象的理论框架。本文以博弈模型为基础,构造出不同的符合实际的变异的博弈模型来研究群体中的合作现象产生的原因,合作增强的机理,动态网络对博弈竞争的影响以及“惩罚”在雪堆博弈模型中的效应具体内容如下。以原始的雪堆博弈模型为基础,我们研究了不同演化机制对两种变异的雪堆博弈模型(多人雪堆博弈和考虑时间收益的多人雪堆博弈)中合作行为的影响。我们发现在全局耦合网络中模型中,在代理人可以“模仿”他人的决策来为自己选择策略的演化机制下,相互竞争的代理人组成的集团将最终演化到所有成员都不合作的状态。而如果这些代理人能够根据自己的既得利益进行“反省”,做出比当前的行为或决策更有利的选择,那么在由这样的代理人组成的集团中总是存在合作行为。同时,我们还进一步研究了这两种变化的多人雪堆博弈模型在动态EZ网络中演化的行为,理论分析与模拟结果相一致。我们提出了考虑时间效应的多人雪堆博弈模型,即合作者如果能够提前完成任务(合作者人数越多则越快完成的任务),将可以得到额外收益。本论文中运用复制动力学的方法研究了我们提出的新模型。我们可以用成本收益比r( = c /b,其中c为成本,b为收益)、额外收益w,以及抽样竞争人数N等参数来表示代理人收益并最终给出稳定态时代理人合作频率的表达式。当额外收益参数w≠0时,系统中的合作频率比w = 0时的情形有明显增加,并且在一定条件下可以出现代理人全合作的状态。这一特征在多人雪堆博弈( w = 0时)模型中没有观察到。这个全合作状态出现的条件为( N ? 1) c <w。另外,我们提出了一个计算机模拟的模型来仿真复制动力学过程,模拟结果与理论计算吻合。同时,我们还研究了考虑时间效应的雪堆博弈模型在动态网络中的演化行为,提出了耦合动态过程的动力学方程,其稳定解与模拟结果相一致。在一些实际情况中,有些合作的代理人可能愿意多付出自己的收益而对不合作者进行惩罚。为了考虑该种效应,我们研究了有合作者、合作惩罚者和不合作者参与的三方博弈的模型。在原始雪堆博弈模型的基础上,当合作惩罚者遇到不合作者时,将牺牲自己的利益α对不合作者进行惩罚,使不合作者的损失收益β(通常有α<β)。我们运用复制动力学的方法研究了在全局耦合网络上,代理人通过“模仿”机制进行演化时,不同策略(合作、惩罚以及不合作)的频率的演化过程和系统稳定态性质。三种策略的最终频率受到整个群体初始时刻的策略频率分布、惩罚参数、雪堆模型的成本收益比等因素的影响,系统最终可能演化得到两种不同的终态:只包含“合作”和“惩罚”策略的终态和只包含“合作”与“不合作”策略的终态。前者反映了因为“惩罚”策略的存在,群体中合作频率得到加强;后者则表明当惩罚力度不够或惩罚人数比例过少时,不合作者将继续存在,并且“合作”与“不合作”策略的频率比例与原始多人雪堆博弈的情形相同。达到两种终态的演化过程有很大的差异。通过分析,我们得出了描述这些过程的动力学方程组,并分析了终态的稳定性问题,其结果以相图的形式在文中给出。我们发现当惩罚频率不低于r /β时,由合作者与惩罚者组成的群体可以抑制“不合作”代理人在整个群体中滋生。

其他学术论文