论文部分内容阅读
【摘要】从传统博弈到演化博弈,博弈论的研究越来越广泛,越来越深入,其中复制动态方程对于博弈论的研究起着至关重要的作用。本文基于有限群体,利用演化博弈的理论建立2×2对称博弈的复制动态方程,求解此复制动态方程的奇点,并分析此复制动态方程在奇点处的稳定及稳定条件,最终得到了与无限群体2×2对称博弈不同的结论。
【关键词】演化博弈;有限群体;复制动态方程;对称博弈
1.引言
演化博弈论结合了经典博弈论与演化生物学的知识,最主要特点是摒弃了完全理性的假设,将参与者视为有限理性。为了内在动力学研究和数学表达的便利性,研究演化博弈论最常选用复制动态方程,因此复制动态方程对其研究起着至关重要的作用。目前对2×2对称博弈[1]和非对称博弈[2,3]、3×3对称博弈和非对称博弈[4]的复制动态方程都进行了演化均衡的稳定性分析,得到了较完整的结论。在这些研究中,对复制动态方程,有一些共同的假设:(1)博弈群体数量无限;(2)博弈个体均匀混合。但是对于种群个数无限大的假设并不符合现实,现实系统中种群规模都是有限的,因此出现了很多研究将假设条件从无限群体变成有限群体[5]。本文将博弈群体从无限变为有限,然后研究博弈的演化過程与最终趋势。
2.2×2对称博弈的复制动态方程
博弈论中,经典2×2对称演化博弈的收益矩阵如表1所示。
表1 2×2对称演化博弈收益矩阵
博弈者及策略
A 参与者乙
B
参与者甲 A a,a b,c
B c,b d,d
表2 奇点的稳定条件
奇点 稳定条件 直接排斥的奇点 可能共存的奇点
, N/A
图1 奇点Ⅰ唯一稳定
收益矩阵的意义是:若参与者甲和乙均采取纯策略A,他们的收益为;若参与者甲和乙均采取纯策略B,他们的收益为;若参与者甲和乙分别采取策略A和策略B,则他们的收益为或。假设有限群体拥有N个个体,有i个个体采取纯策略A,则剩余的N-i个个体采取纯策略B。即个体采v取策略A和B的比率分别为、,且有。采取纯策略A和纯策略B的平均收益分别见式(1)、(2):
(1)
(2)
设,,则(1),(2)可分别改写为(3)、(4):
(3)
(4)
因此我们可以得到基于有限群体2×2对称博弈的复制动态方程如式(5)所示:
(5)
3.复制动态方程的奇点
令,求出复制动态方程的奇点(3个):
,,
每个奇点分别代表不同的物理意义。按其所代表的物理意义的特征可分为2种类型:①在邻域内,2个策略中有1个策略对另1个策略占优,属于这类奇点的有和,其中,时,,B策略比A策略占优;时,,A策略比B策略占优。②在邻域内,2个策略间竞争激烈,在邻域内不存在占优或被占优情形,属于这类奇点是:
此时:
A策略和B策略分别以一定的比例共存。
4.复制动态方程的稳定性
下面分析这些奇点的稳定性及稳定条件。
令,则:
(6)
将三个奇点分别带入上式(6)中,分析每个奇点的稳定条件。
(1)
根据稳定性判定条件,此奇点的稳定条件是:
(2)
根据稳定性判定条件,此奇点的稳定条件是:
(3)
根据稳定性判定条件,此奇点的稳定条件是:
利用二次函数的性质,得到稳定条件为:
化简可得:
最后,总结复制动态方程3个奇点的稳定条件及共存排斥情况,如表2所示。
5.相平面图验证
选取不同算例,利用matlab软件绘制相平面图,验证以上奇点的稳定条件和共存排斥情况。
相平面图 a, b, c, d取值 种群个数N 结论
图1 a=3,b=2,c=5,d=4 2 奇点Ⅰ唯一稳定
20
200
图2 a=4,b=5,c=2,d=2 2 奇点Ⅱ唯一稳定
20
200
图3 a=4,b=2,c=2,d=5 2 奇点Ⅰ和Ⅱ共存
20
200
(1)根据复制动态方程的规律,a=3,b=2,c=5,d=4,策略B占优于策略A。由图1可看出,当种群个体数从2,20,200逐渐接近于无限大时,相应的曲线也逐渐接近于稳定,说明最终演化效果一致。但当N较小时,曲线的拐点会提前出现,证明博弈需要的时间较少,能更快作出决定。
(2)根据复制动态方程的规律,a=4,b=5,c=2,d=2,策略A占优于策略B,由图可看出,当种群个体数从2,20,200逐渐接近于无限大时,相应的曲线也逐渐接近于稳定,说明最终演化效果一致。但当N较小时,曲线的拐点会提前出现,证明博弈需要的时间较少,能更快作出决定。
图2 奇点Ⅱ唯一稳定
图3 奇点Ⅰ和Ⅱ共存
(3)根据复制动态方程的规律,a=4,b=2,c=2,d=5,策略A与策略B双稳定,由图可看出,当种群个体数从2,20,200逐渐接近于无限大时,相应的曲线也逐渐接近于稳定,说明最终演化效果一致。但当N较小时,曲线的拐点会提前出现,证明博弈需要的时间较少,能更快作出决定。
参考文献
[1]吴昊,杨梅英,陈良猷.合作竞争博弈中的复杂性与演化均衡的稳定性分析[J].系统工程理论与实践,2004(2):90-94.
[2]孙庆文,陆柳,严广乐等.不完全信息条件下演化博弈均衡的稳定性分析[J].系统工程理论与实践,2003(7):11-16.
[3]黄仙,王占华.多群体复制动态模型下发电商竞价策略的分析[J].电力系统保护与控制,2009(12):27-31.
[4]Huang Xian.Study on the stable conditions of 3x3 symmetrical evolutionary games[C].Advances in Intelligent and Soft Computing.2012,168(1):197-202
[5]Cressman.R.Evolutionary game theory with two groups of individuals[J].Game and Economic Behavior,1995,11:237-253.
【关键词】演化博弈;有限群体;复制动态方程;对称博弈
1.引言
演化博弈论结合了经典博弈论与演化生物学的知识,最主要特点是摒弃了完全理性的假设,将参与者视为有限理性。为了内在动力学研究和数学表达的便利性,研究演化博弈论最常选用复制动态方程,因此复制动态方程对其研究起着至关重要的作用。目前对2×2对称博弈[1]和非对称博弈[2,3]、3×3对称博弈和非对称博弈[4]的复制动态方程都进行了演化均衡的稳定性分析,得到了较完整的结论。在这些研究中,对复制动态方程,有一些共同的假设:(1)博弈群体数量无限;(2)博弈个体均匀混合。但是对于种群个数无限大的假设并不符合现实,现实系统中种群规模都是有限的,因此出现了很多研究将假设条件从无限群体变成有限群体[5]。本文将博弈群体从无限变为有限,然后研究博弈的演化過程与最终趋势。
2.2×2对称博弈的复制动态方程
博弈论中,经典2×2对称演化博弈的收益矩阵如表1所示。
表1 2×2对称演化博弈收益矩阵
博弈者及策略
A 参与者乙
B
参与者甲 A a,a b,c
B c,b d,d
表2 奇点的稳定条件
奇点 稳定条件 直接排斥的奇点 可能共存的奇点
, N/A
图1 奇点Ⅰ唯一稳定
收益矩阵的意义是:若参与者甲和乙均采取纯策略A,他们的收益为;若参与者甲和乙均采取纯策略B,他们的收益为;若参与者甲和乙分别采取策略A和策略B,则他们的收益为或。假设有限群体拥有N个个体,有i个个体采取纯策略A,则剩余的N-i个个体采取纯策略B。即个体采v取策略A和B的比率分别为、,且有。采取纯策略A和纯策略B的平均收益分别见式(1)、(2):
(1)
(2)
设,,则(1),(2)可分别改写为(3)、(4):
(3)
(4)
因此我们可以得到基于有限群体2×2对称博弈的复制动态方程如式(5)所示:
(5)
3.复制动态方程的奇点
令,求出复制动态方程的奇点(3个):
,,
每个奇点分别代表不同的物理意义。按其所代表的物理意义的特征可分为2种类型:①在邻域内,2个策略中有1个策略对另1个策略占优,属于这类奇点的有和,其中,时,,B策略比A策略占优;时,,A策略比B策略占优。②在邻域内,2个策略间竞争激烈,在邻域内不存在占优或被占优情形,属于这类奇点是:
此时:
A策略和B策略分别以一定的比例共存。
4.复制动态方程的稳定性
下面分析这些奇点的稳定性及稳定条件。
令,则:
(6)
将三个奇点分别带入上式(6)中,分析每个奇点的稳定条件。
(1)
根据稳定性判定条件,此奇点的稳定条件是:
(2)
根据稳定性判定条件,此奇点的稳定条件是:
(3)
根据稳定性判定条件,此奇点的稳定条件是:
利用二次函数的性质,得到稳定条件为:
化简可得:
最后,总结复制动态方程3个奇点的稳定条件及共存排斥情况,如表2所示。
5.相平面图验证
选取不同算例,利用matlab软件绘制相平面图,验证以上奇点的稳定条件和共存排斥情况。
相平面图 a, b, c, d取值 种群个数N 结论
图1 a=3,b=2,c=5,d=4 2 奇点Ⅰ唯一稳定
20
200
图2 a=4,b=5,c=2,d=2 2 奇点Ⅱ唯一稳定
20
200
图3 a=4,b=2,c=2,d=5 2 奇点Ⅰ和Ⅱ共存
20
200
(1)根据复制动态方程的规律,a=3,b=2,c=5,d=4,策略B占优于策略A。由图1可看出,当种群个体数从2,20,200逐渐接近于无限大时,相应的曲线也逐渐接近于稳定,说明最终演化效果一致。但当N较小时,曲线的拐点会提前出现,证明博弈需要的时间较少,能更快作出决定。
(2)根据复制动态方程的规律,a=4,b=5,c=2,d=2,策略A占优于策略B,由图可看出,当种群个体数从2,20,200逐渐接近于无限大时,相应的曲线也逐渐接近于稳定,说明最终演化效果一致。但当N较小时,曲线的拐点会提前出现,证明博弈需要的时间较少,能更快作出决定。
图2 奇点Ⅱ唯一稳定
图3 奇点Ⅰ和Ⅱ共存
(3)根据复制动态方程的规律,a=4,b=2,c=2,d=5,策略A与策略B双稳定,由图可看出,当种群个体数从2,20,200逐渐接近于无限大时,相应的曲线也逐渐接近于稳定,说明最终演化效果一致。但当N较小时,曲线的拐点会提前出现,证明博弈需要的时间较少,能更快作出决定。
参考文献
[1]吴昊,杨梅英,陈良猷.合作竞争博弈中的复杂性与演化均衡的稳定性分析[J].系统工程理论与实践,2004(2):90-94.
[2]孙庆文,陆柳,严广乐等.不完全信息条件下演化博弈均衡的稳定性分析[J].系统工程理论与实践,2003(7):11-16.
[3]黄仙,王占华.多群体复制动态模型下发电商竞价策略的分析[J].电力系统保护与控制,2009(12):27-31.
[4]Huang Xian.Study on the stable conditions of 3x3 symmetrical evolutionary games[C].Advances in Intelligent and Soft Computing.2012,168(1):197-202
[5]Cressman.R.Evolutionary game theory with two groups of individuals[J].Game and Economic Behavior,1995,11:237-253.