基于两步记忆策略的随机博弈演化动力学研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qq231582
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合作现象在社会和生物系统中普遍存在,理解合作的演化动力学可以为克服社会困境和优化多智能体系统提供洞见。演化博弈理论为个体之间的策略动态交互提供了一个强有力的理论框架,一直吸引着生物学、数学、社会科学以及计算机科学领域的研究人员的关注。经典演化博弈主要研究博弈环境不变的演化情况,近年来,研究者们越来越关注博弈环境发生变化的情况。在已有的研究中,往往只考虑了单轮博弈的情况,博弈环境决定个体决策的改变,但是无法探索在长期博弈中个体的决策和博弈环境互相影响的演化过程。为此,近年提出了将随机博弈与演化博弈理论相结合的研究框架,考虑个体采用一步记忆策略,研究表明个体行为与环境之间的相互作用可以提供有效机制来提高合作行为。本文基于随机博弈与演化博弈理论,讨论在含ALLC,ALLD,WSLS,TFT四种经典策略的种群中,个体在基于两步记忆策略的随机博弈中的演化动力学。本文考虑含有两个不同收益的两人两策略博弈的随机博弈。首先,研究两个博弈模型同为囚徒困境类型博弈的状态独立确定性状态转移随机博弈的演化情况。研究发现,在合理的机制下,基于两步记忆策略的随机博弈可以促进合作的涌现,并且比基于一步记忆策略的随机博弈产生更高的稳定合作率。此外,进一步分析了重要的系统参数(如收益矩阵、学习率、错误率、种群大小)对演化的影响。结果显示,基于两步记忆策略的随机博弈的合作优势在这些参数下是具有鲁棒性的。同时,该随机博弈存在多种状态转移规则能让个体跳出囚徒困境,促进合作的涌现,为设计合理机制,推动合作行为提供有效方法。进一步分析发现,当状态转移规则中对合作行为的奖励越来越大时,稳定合作率也越来越大,并且WSLS策略和ALLC策略的成功与群体的合作行为的提高是强相关的。其次,本文对两个博弈模型为不同博弈类型的状态独立确定性状态转移随机博弈进行演化研究。考虑低收益博弈模型为囚徒困境博弈,高收益博弈模型为雪堆博弈或猎鹿博弈。本文结果显示,基于两步记忆策略的随机博弈同样可以提高和维持种群的合作行为。随后,改变高收益博弈模型的收益参数,深入探索种群中合作的演化与博弈收益和状态转移规则之间的动态演化关系。研究发现当状态转移规则满足高频次合作行为可以转移到高收益博弈时,可以有效地提高种群的合作行为。此时,如果高收益博弈的收益参数满足猎鹿博弈或和谐博弈,个体倾向于全合作;如果高收益博弈的收益参数满足囚徒困境博弈或雪堆博弈,当状态转移规则对背叛行为进行一定的惩罚时,同样会产生高合作率。最后,本文对两种具体的概率性状态转移随机博弈模型进行演化研究。其实验结果表明,只要合作行为有一定概率转移到高收益环境中,就能明显提高合作行为。
其他文献
图像的纹理主要是一种反映图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性。纹理信息分为局部纹理信息和全局纹理信息,其中局部纹理信息不同程度的重复性构成全局纹理信息。一方面,纹理图案中的晶格(Lattice)的提取主要是识别出纹理图案中的具有视觉相似性的小的重复图案的部分,另一方面也便于形成一些比较复杂的纹理图案。另外,由于织物上一些重复图案的出现,使得对
2002年,匈牙利数学家A.Csaszar引入了广义拓扑空间的概念,对广义拓扑空间中的点集性质、子空间性质等做了研究,并在这个拓扑空间中取得了无数成果。广义拓扑实际上是一个半拓扑。因此,2015年胡西超等人将广义拓扑重新命名为上半拓扑,进而也引入下半拓扑的概念并且得到了关于下半拓扑空间中的一些基本结果。此后,不少研究者积极投入,将拓扑再重新剖分成左半拓扑和右半拓扑,并得到这两类半拓扑上的一系列结果
文字图像生成是一种跨模态的交叉性任务,文本描述的逐词含义和图像子区域语义信息之间的内容关联性与一致性,是此任务关注的核心问题。生成对抗网络在图像生成领域的成功使得文本图像生成模型有了新的驱动力,从不同角度进行技术革新的文本图像生成模型层出不穷。文本图像生成主要围绕三大技术问题:语义理解、图像生成和语义一致性。本文以这三大问题为方向,探究现如今基于生成对抗网络的文本图像生成模型的优势与不足之处,分别
数学应用题(MWP)的自动求解问题一直是机器智能研究领域的难点和重点,早在二十世纪六十年代就有学者投身该领域的研究,近年来机器学习的快速发展,大量研究人员通过新技术来解决数学应用题。解决该问题需要涉及多方面的技术,需要把人类语言描述的题目转换为机器可读懂得句子,机器可以通过这些信息进行计算推理得到正确答案。是自然语言理解和自动推理相结合的综合性问题。本文选择了一种先分类再解题的方法来解决数学应用题
随着互联网的快速发展,人们越来越难以在各类信息海洋中快速定位自已所需要的信息,为了帮助用户能更快捷方便的从海量信息中找到自己所需求的信息,推荐系统已经成为关键的一部分了。为用户进行个性化推荐一直是推荐系统研究的热点,但是当面对一个刚进入系统的用户时,系统没有该用户的任何数据,即为“冷启动用户”,此时推荐系统不能进行个性化推荐。用跨域推荐来缓解冷启动问题是目前的研究热点,这一方法为解决冷启动提供了新
近年来,越来越多的学者们致力于非线性偏微分方程解的研究,获得了许多相关问题的重要结果.特别地,解的存在性和不存在性作为研究解的各项性质的重要基础,引起了学者们的广泛关注.随着对非线性偏微分方程的深入研究,分数阶偏微分方程在实际应用和理论分析中的重要性与日俱增.本文研究三类非线性偏微分方程解的存在性和不存在性.首先,在三维空间的情形下,研究一类非线性广义Boussinesq方程局部弱解的存在性.基于
在脑肿瘤临床诊疗过程中,由于医疗资源的稀缺与诊断效率的低下,迫切需要高精度的医学图像分割工具进行辅助诊疗。随着深度学习与神经网络技术的快速发展,使用卷积神经网络来进行脑肿瘤图像分割已经成为当下的主流,但是其对于脑肿瘤信息的利用并不充分,导致精度与效率并不完善。基于此,本文围绕着如何充分利用脑肿瘤信息开展研究。具体而言,本文基于脑肿瘤数据来构建深度学习神经网络模型,用于脑肿瘤图像分割任务,主要工作如
随着计算机计算能力的增强,高维时间序列预测在各领域中的应用也随之更加广泛。宏观经济数据预测是最具重要意义的方向之一。宏观经济数据的许多重要变量,如失业率、消费者物价指数等,影响着每个人的生产生活,也影响着国家稳定和社会发展。同时,宏观经济预测可以为政府、银行和工业部门提供有价值的信息,帮助制定相应的政策。例如,经济萧条的相关预测可以为政府部门制定宽松的财政政策提供合理指导意见。因此,宏观经济变量的
随着光纤技术的发展,光子晶体光纤被提出来,因其具有比传统光纤更优异的光学特性及设计灵活特点,其被广泛用于光纤通讯、光纤传感、非线性光学、高功率激光传输和光纤激光器等领域。负曲率反共振空芯光纤(negative curvature anti-resonance hollow core fibers,NC-AR-HCFs)属于空芯光纤的一种,由于大部分光功率在空气芯中传播,可以利用低非线性、高损伤阈值
在当今的物联网应用中,物联网的功耗高问题始终制约着大规模应用的长期部署,终端设备的处理器模块和无线通信模块是主要耗能部分,达到了毫瓦级别。对于通信模块,低功耗的被动通信方式——反向散射通信给功耗问题带来了新的解决思路,但其通信距离短,大大限制了应用范围。LoRa反向散射通信系统利用了LoRa信号chirp扩频调制技术增大了反向散射的通信距离,但是其系统需要处理器模块进行信号处理与控制,功耗仍居高不