基于N维非合作博弈

来源 :商 | 被引量 : 0次 | 上传用户:liyuanboliwenya2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一、绪论
  1.目的
  本文从二维非合作博弈①出发,推广至N维,人为地改变影响博弈的量,改变原博弈均衡②,使结果朝着有利于资源利用的方向变化,解决社会中存在的资源在众人中合理分配问题。
  二、理论基础
  1.n维非合作博弈均衡点存在性
  由角谷静夫定理可推断有均衡点存在。基于角谷静夫不动点定理而对存在性定理给出的证明(发表在:Proc.Nat.Acad.Sci.U.S.A.pp.48-49),该方法直接由布劳维尔不动点定理得出。证明的是在n维空间里构建一个连续变换的T,使得T的不动点就是博弈的均衡点。由于n维混合策略空间是一个胞腔,且由布劳维尔不动点定理可知映射T至少有一个不动点ε,该点一定是一个均衡点。③
  三、乘车博弈
  1.乘车问题
  AB两理性人住在两个房间(信息不对称④),居住处仅有1辆车仅能容纳1人(资源稀缺性⑤),明天为假日,AB都想出行,由于无法交流,他们只能在有限的时间里,进行博弈。假定效用⑥最大值为1,最小值为0,中间值为0.5。
  第一种情况:AB都选择明天去,车无法满足需求,资源配置不足。效用和为1.5(最大值为2)。
  第二种情况:A认为B选择明天去,所以A不准备明天前往,而B没有考虑到这种情况,从而选择了明天前往,AB中一人明天前往,一人后天前往,资源合理配置⑦,此时效用和为1+1=2,为最大效用和。
  第三种情况:AB都认为彼此明天前往会给对方带来威胁,于是都选择了后天前往,这种情况就造成了明天空车现象与后天超载现象,带来的效用和为1.5。
  第四种情况:A若考虑到“B若认为A明天前往从而B选择后天前往”的情况,也许A就选择明天前往,但同时,若B也考虑到“A若认为B明天前往从而A选择后天前往”的情况下,B就会选择明天前往,这样,明天又会造成超载的情况,此时的效用和为1.5。
  第五种情况:考虑到彼此的三步潜在决定从而做出的决定。
  第n中情况:考虑到彼此的N步潜在决定从而做出的决定。
  双方会陷于无尽的博弈循环中。不交流则不了解,只有靠判断做出决定。考虑的潜在决定步数决定了是否能达到效用和最大的情况。双方出现相差为奇数的情况,如A考虑一步,B考虑了两步,就会出现效用和最大的情况,但出现偶数的情况,如A考虑一步,B考虑三步,那么,资源仍然分配不均,不能带来效用最大化的情况。所以,只要他们分开前往,所得到的总效用为最大2。
  四、二维博弈模型分析
  1.总效用的模型表示
  将以上效用表达如下:
  任何有限的非合作博弈至少存在有一个均衡点,而且非合作博弈均有可解性与强可解性⑧,证明来自John F. Nash,Jr论文。
  2.博弈斗争性模型
  基于以上的分析,可以得出以下结果:
  (1)A考虑1+X步,B考虑2+X步,那么所得的博弈结果是一个明日前往,一个明日不前往,这时候所得的效用是最大的。
  (2)A考虑1+X步,B考虑3+X步,那么所得的博弈结果是一个明日前往(不前往),一个明日前往(不前往),这时候所得的效用是最小的。
  另外:无论X为多少,它不影响博弈的结果,“A考虑1+X步,B考虑2+X步”这种情况与“A考虑1步,B考虑2步”的结果是一样的。“A考虑1+X步,B考虑3+X步”与“A考虑1步,B考虑3步”所得的结果也是一样的。
  X在这里只不过是一个循环数,本研究将其称为“循环因子”。
  把A的博弈动态转化在圆上,把B的博弈过程转化在另一平面的圆上。相切于a、b两点。
  假定前提:
  (1)两个圆都只是AB各自的博弈过程,AB两人是两个质点。
  (2)A循着大圆作博弈结果,而B则循着“椭圆”作博弈结果,他们在环上所做的半个循环步数(每半圆)即为前面说过的考虑潜在决定的步数。
  (3)a、b都只能容纳下一个质点,a表示明天不前往,b表示明天前往。同时,椭圆可围绕a、b转动,即a、b是“椭圆”的轴。我们以θ来表示“椭圆”的偏转角度,0≤θ≤π2,θ受理性人的心理偏好与外界因素的影响,θ越大,表示对“前往”的心理偏好越大,反之亦然。
  (4)A、B只有a、b两个停靠点,也就是博弈的决定点。
  (5)心理偏好是相对的,我们固定大圆固定不变,“椭圆”进行旋转。
  描述AB博弈过程:
  (1)AB同时停留在a点,这就导致资源未达到合理分配,表示A、B两人都做出了明日不前往的决定。
  (2)AB同时停留在b点,这也导致资源未达到合理分配,表示AB都做出了明日前往的决定。
  (3)A停留在a点,B停留在b点,或者A停留在b点,B停留在a点,资源都能达到合理的分配,表示一个明日前往,一个明日不前往(后天前往)。
  (4)该模型也符合循环因子X的假设,即只要A选择其中一个停靠点,那么B是经过几个循环才选择到停靠点都跟X无关。
  θ的意义:
  1、
  θ取值为π2,“椭圆”已经围绕ab两点旋转至与大圆重合,极端情况,表示AB两人都具有极强的明天前往的心理偏好,只会做出前往的决定,阴影面积为圆面积,它为大圆面积的100%,即表示,AB明日同往的概率为100%。
  2、
  θ取值为0,“椭圆”已经围绕a、b两点旋转与大圆垂直,极端情况,表示AB两人是互相完全排斥的,他们都做出不前往的决定,而且一直不前往。阴影面积为0,也就表示AB明日同去的可能性为0。
  3、
  AB对明天“前往”具有不同心理偏好,θ取值在0与π2之间。将θ作为常量处理,即不受其他因素影响,考虑AB共同前往的可能性。“椭圆”偏转角度θ越大,AB的心理偏好越强,同去的可能性越高。   阴影部分占大圆面积比例m:
  m=阴影面积大圆面积=πr2sinθπrr=sinθ
  阴影占大圆面积的比例m仅仅与θ有关。
  3.假设前提
  m=sinθ,反映的是AB两人在非合作博弈中最终一同前往的可能性,这也间接地反映了AB两人的心理偏好与预期效用⑨。
  效用函数,就是赋予个体的每一预期一个实数。效用函数并不唯一,如果U是这样一个函数,那么a>0时,au+b也是这样一个函数。如果用大写字母表示预期,小写字母表示实数,这样的效用函数满足下列性质:
  (1)uA>uB等价于A优于B,以此类推。
  (2)若0≤p≤1,则u[pA+(1-p)B]=pu(A)+(1-p)u(B)⑩
  对一人单独分析,引入“潜在前往因子”和“非排斥因子”。
  用m=sinθ来间接表示这种预期效用与偏好的动态过程。θ增大,AB两人共同前往可能性越大。用sinθ曲线间接表示预期效用,则沿着sinθ所作的切线即为预期边际效用MU,切点处与原点所围成的图形面积即为预期效用。随着所作决定时考虑的潜在决定的步数的不断增加,预期边际效用MU逐渐递减,符合边际效用递减规律。等同于 “非排斥因子”的概念,即随着A前往的概率越来越大。同时,A也总会考虑B的前往决定从而对自己的决定产生犹豫,而对B的犹豫又会与自己想得到最大的预期效用相违背,于是产生了这种博弈。这时候两人相互的排斥力也越来越大,即“非排斥因子”越来越小。我们可以用sin′θθ = t 来表示“非排斥因子”。
  另一方面,由于理性人都想让自己的满足程度达到最大,所以A前往的潜在决定越来越大,即A前往的可能性也越来越高,∫t0sinθdθ 在0≤θ≤π2时它的值在0-1之间呈概率分布。θ偏转角度越大,∫t0sinθdθ 的值也就越大,前往的可能性也就越高,把它看做“潜在前往因子”。
  4.博弈均衡
  (1)非排斥因子>潜在前往因子,A的预期效用很大,因为他觉得B与他之间的“排斥力”很小,所以A前往的可能性极高,在原点时达到最大,他会有很强的心理偏好来引导他做出“前往”的这一决定,直到他的非排斥因子不能承担为止。
  (2)非排斥因子”<“潜在前往因子”时,A的预期总效用已经很大,同时,由于他的非排斥因子已经小于潜在前往因子,那么,由于对B的决策的犹豫,他们之间的“排斥力”很大,A作为一个理性人不会再产生“前往”的心理偏好,这时候,A的决定就会停留在一个自己能接受的点上。
  (3)所以,理性人会把决策均衡点放在非排斥因子=潜在前往因子的时候,只有在这个时候,没有任何其他的“排斥力”会使得决定人的心理偏好发生改变从而做出重新选择前往的决定,这时候,决定人的心理趋向于一种既安全又满足的状态。
  假设存在t,使得“潜在前往因子”=“非排斥因子”成立。
  ∫t0sinθdθ =sinθ′θ = t
  ∵∫t0sinθdθ =sinθ′θ = t
  ∴ -cost-1=cost
  ∴ cost=12
  得t=π3,均衡点的角度为θ=π3,m=sinπ3=32
  在AB博弈过程中,最终有cosπ3=12的预期边际效用,使得AB在明天共同前往的可能性为sinπ3=32≈0.866。在二维非合作博弈中,如果两人都将对方的潜在决定作为自己下决定的依据,想得到最大效用,则做出共同“前往”的可能性约为0.866。但均衡解未必是最优解。
  五、二维到N维非合作博弈
  1.N维非合作博弈模型
  多维博弈的模型图表示的是不同人的彼此之间的非合作博弈过程。此时,均衡角度依然是θ=π3,事件之间相互独立,但他们要一同做出“前往”的可能性就被影响因子缩小了,小于0.866。当维数趋于非常多的时候,阴影部分共同区域的图形就越可测量。
  2.模型讨论
  θ对实验的影响:
  当θ=π2 时,所有平面的圆都旋转与大圆重合,这时候n = 1,表明在所有人都具有相同的极端强烈的心理偏好的情况下,N人都将会选择第二天“前往”。这是一种极端情况。
  2、
  维数等于圆个数,它们彼此相切相互影响。维数越趋向于正无穷,其结果越接近真实值。强调两个前提:(1)凡是在一个模型中,所有参与非合作博弈的人具有相同的心理偏好B11;(2)旋转角度θ是基于对某特定事件的心理偏好B12。
  3、
  如果每个人都具有相同的“不前往”的心理偏好,那么此时,旋转角度θ=0,同时n = 0,即明天将不会有任何人前往。
  3.N维非合作博弈模型的总结
  表述:
  (1)宏观上,同心理偏好群体(N维)一定前往的话,他们同去的可能性为sin2θ=1。微观层面上,两个人的博弈,一同前往的可能性也为100%。此时旋转角度θ=π2。
  (2)宏观上,同心理偏好群体非常想去的话,他们同去的可能性为sin2θ=34。微观层面上,两个人的博弈,一同前往的可能性为sinθ=32,此时旋转角度θ=π3。
  (3)宏观上,同心理偏好群体都可能前往的话,他们同去的可能性为sin2θ=12。微观层面上,两个人的博弈,一同前往的可能性为sinθ=22。此时旋转角度为θ=π4。
  (4)宏观上,同心理偏好群体都无所谓前往不前往的话,他们同去的可能性为sin2θ==14。微观层面上,两个人的博弈,一同前往的可能性为sinθ=12。此时旋转角度为θ=π6。
  (5)宏观上,同心理偏好的群体都不前往的话,他们同去的可能性为sin2θ=0。微观层面上,两个人的博弈,一同前往的可能性为sin2θ=0。此时旋转角度为θ=0。   六、应用
  1.二维博弈
  AB分别为此次假设中的乘客,他们彼此将对方的想法作为自己做出决策的基础,由第四章可知,若AB一定前往,则两人有100%的概率相撞;若AB可能去,则会有22的概率相撞;若AB都无所谓,则有0.5的概率相撞。若事先得知二人的偏好程度,可以调整公交车数量。
  2.多维应用
  国庆前,抽样得知,国庆节将有4000人去华山,他们彼此间都担心对方的前往会不会给自己造成不便,且他们只对具有相同心理偏好的人产生博弈。抽样显示,一定前往1000人,非常想去1000人,可能去1000人,无所谓1000人,那么,国庆那天,预计会去的人数为:
  1000+1000×34+1000×12+1000×14=2500
  若华山承载上限为2000人,则应及时考虑降低群体的偏好即θ,如提高票价,或者安排部分去泰山游玩等来降低他们的预期效用,使资源达到最佳配置;若华山的承载上限为3000人,则应及时考虑提高群体的偏好即θ,如降低票价,提供更多的宣传和服务以及开放华山其他游玩项目等,从而使资源达到最佳配置状态。
  注解:
  ① 该词摘自:Robert S.Pindyck,Daniel L.Rubinfeld. 微观经济学[M].北京:中国人民大学出版社,2009:467
  ② 博弈均衡指n个参与人的一组策略(纯策略或者混合策略)选择,在其他人策略选择不变的情况下,任何人都不能通过改变策略来使其期望支付得到改善。
  ③ 引自:John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012:33-34
  ④ 信息不对称:不同经济主体缺乏信息的程度往往是不一样的。
  ⑤ 资源的稀缺性:一些资源的数量是有限的,具有排他性或竞争性。
  ⑥ 引自:Robert S.Pindyck,Daniel L.Rubinfeld.微观经济学[M].北京:中国人民大学出版社,2009:76
  ⑦ 合理配置:即帕累托最优状态。
  ⑧ 强可解性:具有特殊性质的解。
  ⑨ 预期效用:心理上所认为会得到的效用,是一种计划效用,非实际效用。
  ⑩ 引自:John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012:4
  B11 前提(1)来源于阿罗不可能定理。该定理是这样表述的:如果众多的社会成员具有不同的偏好,而社会又有多种备选方案,那么在民主的制度下不可能得到令所有的人都满意的结果,即博弈无解。所以必须要有这样的假设前提。
  B12 为了方便计算所给出的一种标准,也可以以“事件的反面”来进行计算。
  参考文献:
  [1] John F.Nash,JR.纳什博弈论论文集[C].北京:首都经济贸易大学出版社,2012
  [2] Robert S.Pindyck,Daniel L.Rubinfeld. 微观经济学[M].北京:中国人民大学出版社,2009:467
  [3] Kakutani S.Duke Math.[J].8,457-459(1941)
  [4] Von Neumann J,Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton:Princeton University Press,1941
  [5] Nash J F.,Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press,1950
其他文献
摘 要:教育是一门科学,而科学的价值在于求真。教学模式理应随着教育、科技的发展而发展,不断注入新的内涵、新的精神。近年来,基于互联网发展的新型教育形态正风靡全球,其快速发展也获得了互联网巨头和资本市场的青睐。随着现代人对碎片化、多样化学习需求的与日俱增,互联网教育也越来越被接受。职场云服务平台基于互联网技术,旨在为大学生提供职场执业技巧和解决方案等咨询服务,增强学生执业能力与从业技巧。本文以成都大
期刊
摘 要:近年来,随着社会的不断发展和经济水平的不断提升,企业盈余问题逐渐成了人们关注的焦点。盈余问题的有效管理与企业的经济效益息息相关,因而企业在发展的过程中,应深化对盈余问题的分析与关注,并将其化为企业发展中的优势,稳固企业在市场竞争中的地位。本文从企业盈余问题管理的原因分析入手,并详细阐述了企业盈余管理问题的治理对策。  关键词:盈余问题;管理;对策  一、企业盈余问题管理的原因分析  (一)
期刊
摘 要:近年来,随着经济体制不断改革,企业中的财务管理在社会中受到广泛关注。企业财务管理是企业经济发展的保障,在企业中建立财务监督机制,能够有效的促进企业经济发展。基于此,本文就大庆塑钢门窗厂的财务管理现状和监督机制中存在的问题进行分析,并提出改革建议。  关键词:中小企业财务管理;监督机制;研究  一、中小企业的界定及其特征  (一)中小企业的界定  在中小企業经济发展管理中,财务管理以及监督制
期刊
摘 要:本文以豫南某村落社会为例,探讨隐喻型、奖惩型、监控型等类型的民俗控制在“人场”中的表现与作用。同时,村落社会的变迁也对以上各种民俗控制产生一定影响。  关键词:“人场”;民俗控制;村落社会  一、“人场”意义的界定及其活动主体、活动内容  “人场”是豫南农村村民对村落社交场合的称呼。民众在这个场合之中,聊天、谈论村落里发生的大大小小的事。可以说,“人场”是民众娱乐、交流信息的场合,也是村落
期刊
摘 要:本文从马克思关于矛盾的观点出发,指出人本管理的根源在于人性和制度的关系。在“复杂人”假设的前提下,主要从关注人性和制度建设两方面给出解决人本管理根本问题的建议,指出了“人性为主,制度为辅”的人本管理发展趋势。  关键词:人本管理;人性;制度;复杂人假设  一、引言  海尔集团首席执行官张瑞敏提出了三只眼理论:中国处于社会转型阶段,在计划经济向市场经济转化过程中,中国企业应长三只“眼”——一
期刊
摘 要:建设服务型政府是人类自觉应对全球化、后工业化挑战的基本途径,也是当前中国行政改革的核心议题。本文意图对服务型政府的产生、发展作以梳理,描绘其经历了从管制到服务的转变,从而说明服务型政府建设的意义。  关键词:管制;服务;服务型政府  一、服务型政府为何出现的背景  任何理论的提出都是有着其产生的时代背景,有着社会需求的渴望,有着相应群体的呼声。而服务型政府理论的提出,就是基于以中国政府30
期刊
就像手机、电子产品需要充电一样,职场人同样需要充电,以应对瞬息万变又“压力”山大的职场。职场中人应该何时去充电,这并没有相应的“数字”,但还是有一定的信号的。如果出现了以下五种信号,就说明你应该充电了。  感觉目前的职业没意思  如今竞争激烈的职场生存环境中,找一份比较合适的工作都很困难,找一份自己喜爱的工作更是难上加难。如果想在一个行业中深入发展下去,充电是必不可少的途径。如果你觉得目前的工作很
期刊
摘 要:关于梁启超是否传播了马克思主义,学术界观点各异。一个真正的马克思主义传播者他首先应该是马克思主义理论的信仰者,其次他传播的应该是马克思主义理论的科学体系,再次他的目的应该是为无产阶级斗争的需要服务,基于这三点理由,对梁启超的思想和言论进行分析,得出他并没有传播马克思主义,并对其进行客观的评价。  关键词:梁启超;传播;马克思主义  一、对马克思主义在中国传播的思考  如何认识马克思主义在中
期刊
中国梦,是中共十八大后,习近平总书记所提出的重要指导思想和重要执政理念。中国梦蕴含丰富的科学内涵,它的提出把中华民族伟大复兴、社会主义现代化建设与人民群众新期待有机统一起来,回答了“实现什么样的理想、怎样实现理想”这一关乎党和国家命运的重大问题,反映出当代中国发展的客观需要,标志着马克思主义中国化达到新的历史高度,是中国特色社会主义最新理论成果,为坚持和发展中国特色社会主义注入强大正能量。从马克思
期刊
摘 要:本文首先阐述了企业中对员工激励的必要性,分析了对员工的激励和员工个人绩效之间的关系,随后将对员工的培训视为一种对员工的激励方式分析其激励作用,并以链家地产为例,选取家附近几家链家地产作为调查对象,进行问卷调查,证明培训作为一种激励制度对员工的作用。  关键词:激励;个人绩效;培训  一、企业中激励的必要性  美国心理学家赫茨伯格的双因素理论就阐述了影响人们工作动机的因素。该理论认为引起人们
期刊