论文部分内容阅读
科学家们的各种实证性研究已发现在自然界,人类社会和各种系统中合作广泛存在。来自各个学科的研究者竞相研究合作涌现的内在机理,到目前这仍是一个开放的问题,值得研究的问题仍然很多。同时,随着数据处理能力的提升,学者们发现大量的真实系统可抽象为由节点和边构成的网络模型来描述,利用网络的关系研究真实系统内在的关系成为当前的热点。因此,为理解大量个体间的合作行为的演化,学者们将个体抽象为网络中的节点,个体间的互动行为抽象为边,从而利用网络结构研究个体间的竞争行为。这种利用网络结构研究博弈行为的研究即为网络演化博弈。近年来,利用网络演化博弈研究促进合作的机制被学者们广泛关注。机制设计指设计合适的规则,指导方案或建议引导自私的个体能够在注重自身利益的同时使得系统利益达到最优。本文重点提出了几种对合作具有促进作用的机制设计,期望能在发现合作涌现机制方面做出自己的贡献。另外,本文还将探索了网络演化博弈的应用,将其与行人屋内逃生研究相结合,提出了具有优先方向选择的博弈逃生模型,发现了促进逃生的几种方案。本文的主要内容和成果如下。鉴于前人在网络演化博弈中较少关注博弈个体的邻居环境信息对其策略更新决策的影响作用,而在实际的决策中这又是相当重要的,本文认为在实际博弈中确实存在部分个体采用了更为聪明的决策,考虑了邻居的环境信息。因此本文将邻居的环境信息和支付同时引入到机制设计中进行策略更新的决策。由于个体从支付值和环境两方面评估是否模仿某邻居的策略,则需综合两方面的值获得对该邻居的综合评估值。由于证据理论在融合多源信息方面具有得天独厚的优势,本文引入证据理论对支付和环境两方面的评估值进行融合以最终获得对邻居的综合评估值。在此基础上,本文提出了三种模型用于刻画环境信息与支付信息共同作用对合作的影响。一种为综合考虑全局信息与局部信息及支付信息的机制设计方案;当全局信息不易获取时,本文讨论了仅采用邻居局部信息和支付信息的机制设计方案;第三种方案仅考察相异策略邻居局部信息和支付信息情况下合作演化的效果。研究发现三种机制设计皆能促进合作的产生,这表明在博弈中个体关注邻居的环境信息不仅有利于个体自身利益的提高也有利于集体合作水平的提高。由施与惩罚者承担成本的“有成本惩罚”作为对背叛行为的惩罚常被用于以往的研究中,本文提出的模型从新的角度探索惩罚和奖励机制对合作的促进作用。在研究中本文模拟税收机制收取公共基金以承担对背叛行为惩罚的成本和对合作行为奖励的成本,以揭示何种力度与范围的惩罚和奖励更能促进合作的产生。研究发现,中等力度的惩罚效果是最好的,但若无法精确掌握中等的惩罚力度,则优先选择广范围的轻度惩罚,该种机制设计的合作水平高于小范围高力度的惩罚。采用公共基金奖励合作行为的最优效果与之类似,当要奖励合作行为以鼓励更多人效仿时,应该尽可能扩大奖励面,当然伴随而来的是每个获奖个体奖励金额的降低,研究发现该种机制设计比窄范围重力度的奖励更能促进合作的产生。研究成果对社会财富调节等具有指导意义。另外,本文还将综合考虑环境与支付的策略更新机制引入到采用公共基金的奖惩模型中,提出了基于局部信息的公共基金惩罚模型和基于局部信息的公共基金奖励模型。发现该综合考虑方法在公共基金奖惩模型中仍然能促进合作的涌现,同时平均支付也得到了提高。因此,更进一步的验证了综合考虑环境方法的有效性。最后,在网络演化博弈的应用方面,本文提出了综合考虑支付信息与环境信息的博弈逃生模型和带有优先方向选择的博弈逃生模型,其将博弈与行人屋内逃生相结合,以揭示促进逃生的各种机制设计,实际上,逃生的加快也是促进合作的一种表现。首先研究发现当整体人群恐惧指数还不是很高时,处于逃生人群不利位置的个体适当的保持更高的恐惧指数有利于整体人群的逃生,该结论给处于紧急逃生中处于不利位置的个体具有指导意义。其次,本文提出了综合考虑支付信息与环境信息的博弈逃生模型,发现当房间内越多的个体采用综合考虑机制进行移动时,平均逃生时间越能被缩短。另外,本文提出了具有优先方向选择的博弈逃生模型,根据该模型本文验证了在长方形和正方形的房间中门设置在墙中间地段最有利于逃生,其中长方形房间对应的是长边的中间地段。同时,这也表现本文设置的博弈逃生模型有效的模拟了行人逃生过程中的争抢竞争。最后,通过该模型本文发现在博弈逃生模型中当部分个体具有一定学习能力,能够观察学习周围邻居的策略和改变策略的概率时,房间中人群的整体逃生时间缩短。研究成果对行人逃生给出的启示是在逃生中若存在部分具有学习能力、善于观察邻居举动、采用一定的技巧的学习者,则会给整体人群的逃生具有积极的促进作用。