连续博弈中的混合策略性质和它的均衡

被引量 : 4次 | 上传用户：xieyuanming

【摘要】

：

博弈论可定义为是对有理性的局中人之间冲突和合作的数学模型的研究。20世纪90年代中期博弈论成为了主流经济学，在经济理论中具有非常重要的地位。纳什、海萨尼和泽尔腾在1994

【作者】

：

于加尚

【发表日期】

：

2007年01期

【关键词】

：

连续博弈混合策略均衡性质

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

博弈论可定义为是对有理性的局中人之间冲突和合作的数学模型的研究。20世纪90年代中期博弈论成为了主流经济学，在经济理论中具有非常重要的地位。纳什、海萨尼和泽尔腾在1994年共同获得了诺贝尔经济学奖，使得博弈论成为经济学分支学科的地位和作用得到了最具有权威性的肯定。随后，博弈论与经济信息学家莫里斯(J．A．Mirrlees)和维克瑞(N．Vickrey)因为在不对称信息条件下关于激励机制的基础性研究，而在1996年获得了诺贝尔经济学奖。2001年诺贝尔经济学奖又授予了阿格洛夫(G．Akerlof)、斯宾塞(A．MSpence)和斯蒂格利茨(J．Stiglitz)，表彰他们对非对称信息博弈论作出的开创性贡献；强化了博弈论的发展趋势。在2005年，奥曼(R．Aumann)和谢林(T．C．Sehelling)由于分别在博弈论的“贴切”概念方面、博弈论在经济学的深层研究的重大成果，和博弈论在哲理方面的重大贡献，而共同获得了诺贝尔经济学奖；这再次说明了博弈论具有非常重要的地位和影响。现代博弈论已形成了一个相当大的理论体系，“成为经济和社会理论的基本演示法”，其威力将是它的重要应用和多方面方向的发展。在博弈论的形成与发展过程中，混合策略或随机策略概念的引进和应用起到了重大的作用。因为在不确定环境或具有风险的情况下，所假定的理性局中人总会追求他的支付的数学期望最大，而数学期望又完全由随机变量分布所确定。这样，在博弈没有严格确定的均衡，且每个局中人都不希望让其他局中人掌握自己的抉择时，最好的方法应该是假定每个局中人都会选择自己策略集上的概率分布来作为自己的策略即混合策略，达到平均支付最大的目的，从而可通过相应模型来模拟和解释人们的行为，研究博弈中局中人决策相互影响、相互依存，共同作用并决定其分配的局势。在博弈论发展中，用混合策略来分析博弈是重要的手段，引入混合策略可以保证纳什均衡的存在。混合策略的引入是对非合作博弈进行预测的实质所在。混合策略纳什均衡是描述非合作行为的、最为本质的概念。在实际经济活动中，局中人(经济人)的策略集通常是无限的，如局中人把产品量或商品价格的选择作为策略，这时其策略有无限多个，因而无限博弈及其博弈的解概念即均衡的研究成为经济学的中心和主线问题之一，大量连续博弈模型在模拟和揭示经济人在经济活动中的行为本质中已发挥了十分重要的作用。在对无限博弈中连续博弈的均衡存在性的研究中，最早的和注重理论与实效的也是混合策略均衡存在性。关于现有的连续博弈的均衡存在性的研究可概括为：在连续博弈中有关混合策略纳什均衡的存在性的纳什均衡存在定理(Glicksgerg，1952)和连续博弈中有关纯策略纳什均衡存在定理(参见I．Glicksberg，1952；G．Debreu，1952；Ky．Fan，1952)；Cournot于1838最早提出均衡的概念，后人称为古诺均衡，即是现在的连续博弈的纯策略纳什均衡；后者是前者的特例。论文的工作和内容的安排本文在Fudenberg和Tirole(1991，2002)相应的工作基础(技术性说明)上，主要对连续博弈混合策略的性质，连续博弈的混合策略纳什均衡存在定理的证明进行了讨论；对求解连续博弈均衡的方法作出讨论，并通过例子来说明；此外，利用紧度量空间是可用有限集充分逼近无限集的数学结构而建立连续博弈与有限博弈的联系，给出了连续博弈混合策略纳什均衡存在性的另一种证明。论文内容安排如下：第一部分为序言，对所讨论问题进行综述；在第二部分预备知识中，给出了一些基本概念与记号，对照于有限完全信息静态博弈中混合策略的性质和均衡(参见刘宗谦，2004，2006)重叙了一些主要内容；在第三部分，给出无限博弈、连续博弈、光滑博弈的概念和策略集上的反应对应及其反应函数，讨论并通过例子来说明求解连续博弈的纳什均衡；在第四部分，提出并证明连续博弈混合策略集上相似于有限博弈中混合策略中的一些基本和重要性质，同样利用预备知识中的方法说明了混合策略纳什均衡的存在性；其中，对二人常和连续博弈提出虽然能用反应函数方程组、反应函数法来解，但是还是可以利用由鞍点定理表明的最小最大原理来求其混合均衡，且给出和证明几个常见的命题；在第五部分，为强调紧度量空间是可用有限集充分逼近的无限集的数学结构的应用，仿照Myerson(1991，2001)给出ε-均衡概念，建立连续博弈与有限博弈的联系，提出和证明了有关的定理、特别是逼近定理；在第六部分，给出了连续博弈混合策略纳什均衡存在性的另一种证明；在最后部分，即结语部分说明和论证了完全信息博弈策略型博弈的混合扩充博弈存在一个纯策略纳什均衡。

其他文献

高速公路挖方边坡防护形式的优化组合

生态防护技术是随着世界范围内高速公路建设而兴起的一门工程技术，它是充分利用植被的护坡机理来稳定边坡，缓解工程建设与生态环境之间的矛盾，减少高速公路对生态环境的影响。传

学位

高速公路边坡工程防护生态防护柔性防护系统

宗白华生活美学思想初探

一代美学大师宗白华的美学思想一直是学界研究的热点，当前对宗白华美学的研究一个思路是把宗白华的美学看作是生命美学，但是诞生于上世纪九十年代的生命美学本身存在着理论缺陷

学位

宗白华生活美学生活

提速货车用双作用常接触弹性滚子旁承

阐述了旁承结构型式的发展 ,介绍了双作用常接触弹性滚子旁承的设计结构及装车试验情况。

期刊

提速货车双作用常接触弹性滚子旁承设计

概念隐喻视角下的《因为我不能停步等候死神》

《因为我不能停步等候死神》是美国著名女诗人艾米莉·狄金森所写的著名诗歌之一;对于该诗的解读,往往大都从文体、主题等传统的文学批评角度去分析,该研究从主要运用认知诗

期刊

《因为我不能停步等候死神》认知诗学概念隐喻映射

用心用情用力服务基层职工群众

<正>《工会博览》:北京市工会十四大召开,您最关心的话题是什么?张树坡:2019年是中华人民共和国成立70周年,是新时代全面建成小康社会的关键一年,是完成中国工会十七大目标任

期刊

工会工作基层职工《工会博览》北京市工会

浅谈诽谤法令在马来西亚传媒中的现状及其影响

本文介绍诽谤法令在马来西亚传播实践中的现状 ,并分析诽谤案例中高额索赔对传播的负面影响。

期刊

马来西亚传媒工作者首席大法官新闻自由

我国高速铁路用钢轨打磨列车选型及应用研究

介绍钢轨打磨列车工作原理、我国高速铁路在用的钢轨打磨列车主要特点和采用的先进技术。并结合高速铁路线路的特点及钢轨打磨作业要求,对我国高速铁路用钢轨打磨列车的选型

期刊

高速铁路钢轨打磨列车选型应用

缓冲器紧固螺栓强度和疲劳分析

　　在地铁列车紧急制动工况下，冲击力若传递给缓冲器紧固螺栓易发生断裂。经受力分析、静强度和疲劳强度校核后，对结构实施了优化，避免了螺栓的断裂问题。

期刊

铁路车辆缓冲器紧固螺栓断裂现象疲劳强度分析

肥胖动物模型的制备原理和方法

<正> 肥胖是一种中老年多见的病症,不仅影响体态和美观,而且有害于身体健康。肥胖症者易发生高血压、糖尿病、动脉硬化、冠心病、胆囊病、癌症及各种感染性疾病。消除肥胖是

期刊

动物模型棕色脂肪组织肥胖模型抗肥胖药下丘脑腹内侧核制备原理

陆懋德学术研究

陆懋德(1888年——1961年前后)，字咏沂，山东历城人，中国现代著名史学家。著述丰硕，主要有《史学方法大纲》、《中国上古史》、《中国史学史》、《中国文化史》(未竟稿)、《周秦哲

学位

陆懋德史学方法文化史考古学史学史中国上古史

连续博弈中的混合策略性质和它的均衡

与本文相关的学术论文