论文部分内容阅读
“潜规则”是一种游离于明文的规定之外,实际存在却无法在正式场合登上台面的规则。“潜规则”的类型有很多,形式也很多样,其中,“利益输送”是一种比较普遍存在的“潜规则”类型,其本质也是一种多重均衡博弈的均衡选择问题。本文以“利益输送潜规则”类型为研究对象,结合归纳博弈理论(Inductive Game Theory)与博弈学习理论(The Theory of Learning In Game)中关于模仿学习的理论来探究多重均衡的选择问题,运用仿真的方法观察主体在不同现实条件以及不同客观收益矩阵下的策略选择,通过仿真的最终收敛情况来反映一些影响因子对博弈均衡选择的影响。结合关于制度的内生观点,通过仿真的方法探究“潜规则”的内生演化过程,以及对“潜规则”演化的影响因素。更为重要的是,如何抑制“潜规则”的扩散,这也是现实中我们更为迫切想要解决的问题。现实司法中,我们往往更加注重对“潜规则”中的受贿人进行严惩,而对行贿人的惩罚较轻,这种做法是否合适?本文中我们探究了加强对行贿人的惩罚对博弈均衡结果的影响,由于主体在策略选择中受到很多的因素影响,比如自身成长经历,教育背景,社会环境以及价值观等等,我们通过对主体主观概率进行修正,探究这些影响因素对博弈主体的策略选择的影响以及对博弈最终的收敛情况的影响。本文主要内容如下:1)假设博弈主体无任何社会偏好,博弈参与者对博弈客观收益矩阵一无所知,通过模仿学习和不断重复博弈,在原本只有两个策略的策略集中通过试错而演化出第三个策略,即“潜规则”策略。本文从利益输送的角度建立了具有多重均衡的博弈仿真模型,通过对利益输送值U和每个主体的初始尝试“潜规则”的概率的变化来观察博弈最终的收敛结果,探究这两个因素对“潜规则”现象内生演化的影响。2)通过比较单独对受贿人惩罚以及同时对行贿人惩罚来探究对“潜规则”现象的抑制效果。模型对上述博弈客观收益矩阵进行一定修正,增加了一些参数,如:行贿人使用“潜规则”被发现的概率p1,对受贿人使用“潜规则”被发现的概率ph,以及对“潜规则”的惩罚力度a,通过期望值的方式来计算客观收益矩阵中每个策略组合的收益值。通过对三个参数的不同组合进行仿真,观察不同组合下博弈最终的收敛结果,探究对行贿人进行惩罚对“潜规则”现象的抑制效果。3)博弈主体对事件的学习认知和主观概率的形成受到多种因素的影响,如:自身经历、周围事例、舆论宣传等,这些影响因素的权重也不尽相同。本文构建了博弈主体博弈学习的主观概率修正模型,在之前基于自身博弈经历以及对周围邻居博弈策略的模仿学习模型上,加入了广播机制,通过调整不同因素在主体主观概率形成中的权重可以观察这些影响因素对“潜规则”现象的抑制效果。通过本文的研究我们可以得出的结论有:1)具有有限理性的主体通过模仿学习和策略调整,在一定的制度环境中,具有“潜规则”特征的第三策略将会向其他主体进行扩散,成为指导主体行为方式的指南。同时“潜规则”策略的扩散既与利益输送值U有关,还与主体的初始尝试“潜规则”的概率有关。2)“潜规则”策略在一定的惩罚力度和一定的被发现概率的环境下不会进行扩散,主体通过学习和策略调整不会倾向选择“潜规则”策略。通过分别对“潜规则”中两类主体进行惩罚,我们发现,在一定的惩罚力度和一定的被发现的概率下,“潜规则”策略都不会进行扩散,并且对行贿人和受贿人分别惩罚的抑制“潜规则”的效果十分相近。在现实中,由于“幸存者偏差”等原因,导致仅对受贿人进行严惩措施失效的情况下,同时加强对行贿人的惩处监督是一种很好的抑制“潜规则”行为的方式。3)在博弈主体的主观模型中加入正向舆论宣传机制可以使“潜规则”传播扩散的难度加大,本章通过仿真实验发现随着正向的舆论宣传在个体中占的比重增加,对“潜规则”策略扩散的抑制效果越加明显。本文的创新之处是通过博弈学习理论和归纳博弈理论结合计算机仿真技术探究多重均衡博弈的均衡选择问题,结合制度的内生观点来解释“潜规则”是如何内生演化而来,通过改进惩罚机制和主观概率修正的方式来抑制“潜规则”的扩散,论文研究得到的结论,为相关政策措施和司法的制定提供了有力的依据。