论文部分内容阅读
博弈论被广泛用于研究各种博弈中个体及群体的合作行为。在“囚徒困境”与“雪堆博弈”模型中,代理人的合作频率一直是人们研究的重点。现实生活中的竞争行为并不总存在于两者之间。因此,人们提出了多种多人博弈模型并对基于该类模型的竞争系统中代理人的合作行为进行研究。例如,考虑“时间收益”的多人博弈模型。另外,最近的一些研究结果表明,在基于“囚徒困境”或“雪堆博弈”模型下,代理人的流动也会提升系统中代理人的合作频率。为了研究多人博弈现象和流动人口对系统合作频率的影响,本论文主要从以下几方面来研究:
在推广的多人博弈模型中引入“自我反省”的演化机制后,系统中总存在一定数量的合作代理人。我们研究了当基于该模型且系统中有两个子系统,每个子系统独立进行博弈,但是各子系统中的代理人可以互相流动到对方的子系统中进行博弈时,代理人的博弈行为。我们发现,由于人口具有流动性,整个系统的不合作行为被抑制,合作频率得到提升。
我们提出了加入惩罚的推广多人博弈模型,首先研究了采用“自我反省”演化机制的孤立系统。我们发现在演化初期,惩罚策略可以使系统出现接近全合作的状态。但经过长时间演化,系统终态与未加入惩罚的系统终态相同。对于系统中有两个子系统,子系统之间可以有代理人流动,我们发现代理人流动性的加快可以使得整个系统很快进入所有人都是合作的状态。当系统中的代理人采用“模仿”机制演化时,惩罚力度不够可能导致系统终态为全合作,也可能全不合作——取决于系统不同策略代理人数的初始分布。对“不合作”代理人惩罚力度较大时,系统会很快演化到所有人都是合作的状态。
基于FedericoVazquez提出的选票模型,我们发现,他们提出的理论并不能很好地解释计算机模拟结果。我们摒弃他们使用的节点近邻二项式分布形式,寻求节点近邻新的分布形式,从理论上分析了系统的统计行为,并计算了代理人之间连接性质发生改变的临界值。计算的统计结果与模拟结果符合很好。