基于声誉的重复博弈的逻辑研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:dfsdfsafdsfds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对社会结构的哲学研究中,如何刻画并分析人的行为、动机及其与他人互动的结果是一个重要的内容,它关系到对社会结构的哲学理论研究是否与客观事实相符合,也关系到研究成果是否具有可操作性以致对人们的社会活动有现实指导意义。博弈论作为一种关注人与人之间的互动的决策理论,对研究人们在相互作用下如何理性地进行决策有不可忽视的帮助。囚徒困境作为非合作博弈论中最经典的博弈模型,以简洁而清晰的方式向人们展现出纳什均衡等博弈论中的各项重要基本概念。囚徒困境博弈反映了一个常见且深刻的哲学问题:个体利益和集体利益之间的冲突和取舍。如何在囚徒困境中同时保证个体利益和集体利益是学者们最关心的问题之一。为了解决这个问题,博弈的重复进行是人们常用的切入点。通常情况下,即使博弈重复进行也难以确保博弈得到合作的结果,然而人们认为声誉可能是解决这一问题的办法。本文的主要研究目标有两个,一是借用布尔博弈模型,在逻辑上刻画重复和声誉这两点对囚徒困境博弈的影响,并在此基础上为重复囚徒困境博弈选择一个好的声誉模式。二是研究博弈在不完全信息下所面对的困难,并引入声誉来解决这些困难。为了实现这两个目标,本文首先研究了布尔博弈的逻辑结构,且根据布尔博弈模型对常规囚徒困境博弈进行了逻辑刻画。在此基础上,以囚徒困境博弈为出发点,将声誉加入布尔博弈模型中,并对不同的声誉机制进行了分析和对比。最后,根据不同博弈面对的不同困难,分析其与现实相对应的逻辑规则,针对不同的博弈结构设计声誉机制以解释博弈中的合作问题。文章主要分为以下几个部分:第一,本文为囚徒困境博弈构建了布尔博弈模型,并将表示声誉的算子引入布尔博弈模型中。对于布尔博弈中声誉的处理方式,根据博弈参与者对声誉在层级上的要求的不同,可以构建出不同的刻画方式。本文在此基础上进一步将声誉刻画为布尔博弈模型中的首要目标。当参与者意识到自己如果严格追求效用最大化将陷入博弈困境时,会转而考虑声誉的变化。根据布尔博弈的结构,参与者们除了在结果上的收益之外,也会在博弈中优先考虑其他方面的收益。由于在原有的纳什均衡中,参与者无法获得关于其他方面的较为理想的收益,因此参与者会设立一个简单的或复合的目标,并尝试以实现该目标为基础,通过打破博弈的均衡的方式来获得比原有结果更好的收益,或在个人收益不变的情况下增加集体的收益。在这之中,参与者们可以根据自身需求的不同,将对声誉的要求刻画为与首要目标并列的成分或次于首要目标的成分。不仅如此,参与者还可以根据自身对声誉的要求,对自己的首要目标进行一个限制,通过该限制生成一个新的首要目标,以此体现出声誉对布尔博弈的影响。第二,本文通过对布尔博弈模型中不同的声誉机制的对比来检验了声誉对博弈的影响。文中通过案例分析论证了声誉并不能保证博弈一定满足集体的利益,但恰当的声誉模式可以让博弈规避掉最差的结果。对声誉模式的研究有必要将声誉的功能由系统的深化为对个体行为的分析,更精细地刻画出声誉对博弈的重要影响。在博弈时可以只考虑自己的声誉,也可以只考虑对手的声誉,还可以将博弈双方的声誉结合起来。当博弈重复进行时,引入声誉可以有效防止由逆向归纳法导致的诸如蜈蚣博弈等博弈困境,但并不能敦促那些不需要博弈继续重复进行的参与者选择合作。在重复囚徒困境博弈中,声誉更多的是体现参与者选择某种策略的倾向,而不是对参与者给与好或坏的评价。声誉在现实中的作用不仅仅是对人们合作倾向的反映,在很多种情况下,它能决定一个经济行为是否可以发生。参与者们在博弈中有越多的选择权,声誉越能起到促进合作的作用。随着博弈的参与者们对声誉有了更严格的要求,博弈将能够达成合作均衡。由于特定的声誉限制条件将声誉好坏的差异放在了博弈是否重复上,因此不需要参与者们通过选择背叛策略来惩罚坏声誉者。这样的声誉机制更接近实际情况,人们在现实中通常是不会通过背叛来惩罚失信者,毕竟这种行为本身与声誉的建立初衷相违背。第三,本文分析了关于对手信息价值的多面性,并论证了引入声誉不会将一个博弈问题变成只考虑某个参与者自身的决策问题。一方面,声誉作为参与者收益的一部分,需要结合收益的其他部分来作为参与者的策略选择依据。不同的策略选择不一定会带给参与者不同的声誉。另一方面,如果同一个策略所获得的声誉不仅仅取决于自身,还取决于对方的某些属性或某些选择,那么对方的信息依旧是不可或缺的。参与者在做策略选择时,依旧需要考察对手的基本信息,同时还要对对手的策略选择进行合理的预估。第四,当博弈的信息不再完全时,为了获得更多的集体利益,需要根据信息状态的不同调整声誉模式。当关于博弈对手的信息并不完全时,针锋相对策略被一些经济学实验证实为一个能在重复博弈中有效保证自身利益的回应方式。但是针锋相对策略一旦被激发将很难让博弈双方重新考虑合作,而通过引入声誉,将为针锋相对策略提供了一个缓冲区间以便参与者们寻求合作。本文为博弈双方设定一个初始声誉值,当参与者选择了合作策略后,他的声誉值增加,反之则减少。修正后的针锋相对策略只有在博弈对手的声誉值低于某个预设的临界点时才会触发。针对现实中普遍存在的博弈信息不完全现象,本章给出了根据布尔博弈模型进行分析的带有声誉的分析方法,并解释了声誉如何帮助不完全信息博弈获得合作均衡。本文对声誉所具有的时效性和区域性这两个问题进行了分析,并解释了其对博弈的影响。第五,带有声誉的布尔博弈模型在研究囚徒困境博弈时具有较好的效果,特别是在分析合作均衡方面。借助布尔博弈模型,我们对多种博弈进行了研究,发现正是以声誉为代表的一系列外部环境因素,导致了现实中的经济活动和经典博弈模型中的分析结果之间的差异。这样的探索一方面拓展了布尔逻辑的应用范围,另一方面丰富了现有的对重复博弈理论研究的思路。
其他文献
在智能时代,智能技术在教育领域得到了广泛应用,为教育教学发展带来机遇的同时,也对智能时代背景下人才培养提出了全新的诉求。从育人目标、价值观念、技术支持、教学模式等方面重构智能时代的教学范式不仅是时代发展的应然反应,也是教学系统不断顺应技术发展的必然趋势。构建智能技术与英语教学深度融合的教学模式,培养学生学科学习能力、自主学习能力和高阶思维能力,是智能时代下英语学科教育改革的发展方向和重要内容。在此
学位
临床上食管癌晚期病人治疗方案的选择面临着进退两难的境地,常用的化疗手段在杀死肿瘤细胞的同时又会带来全身毒副作用,且对吞咽困难症状缓解甚微。而可以用于打开腔道狭窄的食管支架却只能姑息性治疗食管癌,并不能杀死肿瘤细胞。为了“取长补短”地结合支架与化疗,我们设计制备了抗肿瘤药物/食管支架组合体,既能快速打开恶性腔道狭窄,又能给予局部化疗,低毒、高效地杀死肿瘤细胞。首先利用乙烯-醋酸乙烯高聚物(EVA)作
学位
党的十九届五中全会将“全体人民共同富裕取得更为明显的实质性进展”作为2035年的远景目标之一。2020年我们决胜全面建成小康社会进而开启乡村振兴建设的重大战略任务,是新中国贫困治理史上具有重要意义的一年。习近平总书记指出:“脱贫摘帽不是终点,而是新生活、新奋斗的起点。”(1)后小康社会,如何走好扶贫开发之路,巩固好来之不易的脱贫成果,是中国必须要面对的一个重大课题。文章对新中国成立以来中国共产党带
学位
自我概念清晰性(self-concept clarity)是指自我概念的内容被清晰和自信定义的程度,反映了个体自我概念的内部一致性及确定性,并具有相对的稳定性。根据自我一致性理论和自我差异理论,个体保持一个连贯一致的自我概念和身份,对其心理健康的发展具有重要作用。主观幸福感(subjective well-being)作为心理健康的重要测量指标,指个体根据自身确定的标准对其生活质量的总体性评价,包
学位
时距知觉与很多认知活动密切相关,其中毫秒到秒的时距感知对个体的运动控制、语言加工等都具有重要意义,因此对时距知觉机制的探讨是十分必要的。然而不同于视觉、听觉等感知觉,时距知觉没有一个专门加工的感受器官,这为时距知觉的机制探讨增加了难度。值得庆幸的是,被称为“心理物理学家的微电极”的感知适应技术,为探索感知觉的神经机制提供了一种无创性的方法。适应后产生的适应后效可以分离出对某一刺激属性有选择性反应的
学位
道教美德伦理的研究动机源于三个方面。第一,思考前沿的学术论题:美德伦理学是一个新兴的规范伦理学视角,需要从不同的思想传统中汲取有益的资源,比业已成熟的义务论和后果论(功利主义)更加具有开放性和包容性;美德伦理学关注有德之人、幸福生活、有意义的人生(人生的价值)、美德品质、美德培育(修身)等话题,这些话题更具古典气息与恒久意义,显然,道教也对这些问题有着深入的思考。第二,从比较的视野出发探究道教伦理
学位
本定性案例研究描述了教学领导者在教学监督中具有促进有效教学的作用,力图为公立小学教学监督无效的问题提供策略。因此,本研究的目的是通过找出被认为有效的教学监督中引入的实践和支持的有效形式来改善教学监督,以促进有效教学,从而为红衣主教大都市公立小学的有效教学做出贡献。该研究进一步试图确定教学领导者在指导他们实践的教学监督中的作用,以及他们如何成功地获得有效的监督。使用焦点小组讨论、观察法、文献法和半结
学位
随着积极心理学和健康心理学的发展,探究幸福感的影响因素也成为不同领域学者着重关注的目标之一,揭示这一问题的答案对提升个体的生活质量,优化政府的公共服务与管理,促进社会的和谐稳定具有重要意义。基于不同的哲学基础,现有的幸福感研究主要包括快乐论与实现论两种取向。快乐幸福感从快乐论发展而来,认为幸福是一种快乐的心理体验,个体一切活动的出发点是为了追求快乐而避免痛苦。实现幸福感从实现论演化而来,认为幸福并
学位
现代数据中心在不断的与用户和其他的系统产生交互,而数据中心往往采用廉价的服务器,因此很容易发生单点故障,导致严重的损失。由于数据中心通常是由大量的服务器所构成的复杂系统,因此可以通过冗余机制来保障基础设施与应用系统的高可用性。例如,采用Fat Tree等网络拓扑实现端到端的多路径网络传输,保证网络基础设施的高可用性;通过数据的多副本机制,保证节点故障后数据的可恢复;为业务应用提供冗余节点与带宽,保
学位
在不同的社会阶层环境下生长会对个体的心理和行为产生深刻而广泛的影响。过去几十年里,大量研究表明社会阶层会对攻击产生影响。低社会阶层被视作是攻击的风险因素之一,与高阶层者相比,低阶层者生活在较困难的社会生态环境下(如面临更多的威胁、不可预测性),他们可能会产生一些适应性的行为模式以应对威胁环境,例如攻击行为。但关于二者关系的研究结果并非总是一致,有研究发现低阶层与高攻击相关,也有研究发现二者存在正相
学位